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Vorwort zur fünften Auflage 

Von der ersten bis zur fünften Auflage hat sich an den deut- 
schen Hochschulen einiges verändert. Insbesondere die Umstel- 
lung auf Bachelor-Studiengänge führt dazu, dass einsemestrige 
Einführungen in die Statistik wieder mehr abgehalten werden. 
Dem trägt das Buch durch eine veränderte Kapitelstruktur Rech- 
nung, die sich daran orientiert, für verschieden intensive Statistik- 
veranstaltungen und insbesondere für Bachelor-Studiengänge 
nutzbar zu sein. Deshalb ist das Buch modular aufgebaut. Der 
gesamte Inhalt ist für einen einsemestrigen vierstündigen Kurs 
(etwa 14 zweistündige Vorlesungen mit je einer zweistündigen 
Übung dazu) gedacht. 

Für einen Statistik I - Kurs im Bachelor-Studium von zwei Se- 
mesterwochenstunden Umfang empfehle ich die Kapitel 1 bis 9, 
ohne die Kapitel 7.5 - 7.7, 9.3 - 9.6 Mit diesem Umfang erhalten 
die Teilnehmer, die meist keine weiteren Statistikveranstaltungen 
besuchen, einen Einstieg in die Inferenzstatistik (über das Konfi- 
denzintervall), so dass sie den Sinn von Statistik besser einsehen 
können. Je nach Geschwindigkeit des Kurses können weitere Ka- 
pitel ohne Verlust des Zusammenhangs weggelassen oder zugefügt 
werden: bei geringerem Umfang kann man zunächst die für den 
Anschluss an weiterführende Statistikveranstaltungen gedachten 
Kapitel 5.5, 5.6 und 6.4 weglassen; dann alle, die sich auf bivariate 
Zusammenhänge beziehen: 6.6, 6.7, auch 4.5 und 4.6. Bei größe- 
rem Umfang kann man zunächst Zusammenhangsmaße hinzuneh- 
men: 12.2, 10.5, 11.1- 11.3, für weitere Zusammenhangsmaße 
benötigt man 7.5, dann kann man auch 10.1 bis 10.3 hinzufügen. 
So weit benötigt man den Begriff der Signifikanz noch nicht. Alle 
weiteren Kapitel arbeiten mit Tests und Konfidenzintervallen. 

Das Buch ist für Studierende der Sozialwissenschaften gedacht, 
die oft folgende Probleme und Wünsche in Bezug auf Statistik 
haben: 

- wenig mathematische Vorkenntnisse und wenig Motivation, 

sich auf strenge mathematische Formulierungen und Beweise 

einzulassen. 
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- Statistik nicht als Methodenlehre anzusehen, sondern als eine 
Möglichkeit, sozialwissenschaftliche Daten zu interpretieren 
und zu verstehen, 

- die auch für Sozialwissenschaftler unabdingbare Qualifikation, 
Daten mit einem EDV-Programm auswerten zu können oder 
zumindest den von einem solchen Programm produzierten Out- 
put, z.B. in wissenschaftlichen Publikationen, lesen zu können, 

- die mittlerweile ebenso für Sozialwissenschaftler unabdingbare 
Qualifikation, Ergebnisse der Umfrage- und Marktforschung 
substantiell auch statistisch kritisieren zu können. 

Aus Punkt 4 ist der Umfang der hier präsentierten Methoden abge- 
leitet: weil in vielen sozialwissenschaftlichen Studiengängen, und 
erst recht im Bachelor, nur Statistik I (und nicht auch noch multi- 
variate Statistik = Statistik II) verlangt wird, sind hier auch Wahr- 
scheinlichkeits- und Schätztheorie insoweit aufgenommen, dass 
Konfidenzintervalle und damit die Frage der Repräsentativität und 
Signifikanz von deskriptiven statistischen Werten behandelt wer- 
den können. Von Punkt 2. und 3. zusammen stammt die Entschei- 
dung, mit einem ALLBUS-Datensatz als Grundlage der Beispiele 
und mit dem mittlerweile auch in der Wirtschaft weit verbreiteten 
Statistik-Programm SPSS als Grundlage für EDV-Outputs zu 
arbeiten. Um die Beispiele leicht nachrechnen zu können, sind die 
jeweiligen Variablennamen angegeben. Die Datensätze sind um- 
sonst unter der Adresse www.gesis.org/Datenservice/ALLBUS 
verfügbar. 

Punkt 1 führt dazu, dass in diesem Buch auf Beweise weitge- 
hend verzichtet wird und „höhere“ mathematische Symbole in 
Exkursen erklärt werden, und dass der Ausdruck umfangreicher 
statistischer Tabellen unterbleibt. 

Bedanken möchte ich mich für die fünfte Auflage vor allem 
bei meinem Mitarbeitern Torben Frölich, Martin Förster, Caroline 
Kurtz, Romina Müller und William Tarazona, die viele Fehler im 
Text gefunden haben, und bei Elena Tsarouha, die die vielen Kor- 
rekturen vorgenommen hat, sowie bei den Teilnehmerinnen und 
Teilnehmern meiner Vorlesungen, die mich immer wieder auf 
neue Fehler aufmerksam machen. 




Kapitel 1: Was ist Statistik? 



1.1. Die Wichtigkeit von Statistik 

Vor einigen Jahren haben viele in einer Gefahr geschwebt, von der 
sie vermutlich nichts gemerkt haben, weil es eine der typischen 
Gefahren war, die den schlechten Ruf der Statistik begründen: 



25.7.92, Kölner Stadtanzeiger: „Im vergangenen Jahr erkrank- 
ten 115.000 Menschen an der Lebensmittelvergiftung durch 
Salmonellen“. 

15.9.92, Westdeutsche Allgemeine: „Jedes fünfte Test-Ei ent- 
hielt Salmonellen... 200 Eier hatte die Universität Bochum un- 
tersucht“. 

29.10.92, Rheinische Post: „Eine bundesweite Analyse von 
6000 Proben ergab... in einem Fall Salmonellen in dem Dotter“ 
Ausgabe 6/1993, Der Spiegel: Titelgeschichte: „Die Hühner 
schlagen zurück.“ „In den alten Bundsländern hat sich von 1985 
- 1992 die Zahl der amtlich registrierten Salmonellen- 
Vergiftungen nahezu versechsfacht, von rund 35.000 auf 
200.000. Bei mehr als 90% aller Infektionen... wird die wahre 
Ursache vom Arzt nicht erkannt... Die wirkliche Zahl der Sal- 
monellen-Opfer ist demnach seit 1985 von 300.000 auf zwei 
Millionen gestiegen“. 

„Hamburgs Gesundheitsbehörde rechnet damit, dass mögli- 
cherweise jeder zehnte Bürger im Laufe des Jahres an einer 
Salmonellose erkrankt“. Das bedeutet bei 80 Mill. Einwohnern 
etwa 8 Millionen Erkrankte. (Ketteier 1997:40-42) 



Wenn man diese Zeitungsmeldungen zusammennimmt, lag die 
Chance, an Salmonellen zu erkranken, in den Jahren 1992/93 zwi- 
schen 0,13% und 10%. Nach diesen Zahlensalat scheint die Frage 
berechtigt, ob es überhaupt möglich ist, die verschiedenen Unter- 



V. Müller-Benedict, Grundkurs Statistik in den Sozialwissenschaften, 

DOI 10.1 007/978-3-53 l-93225-5_l, © VS Verlag für Sozialwissenschaften | 
Springer Fachmedien Wiesbaden GmbH 2011 
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suchungen und ihre Ergebnisse zu vergleichen. Liegt hier nicht ein 
Beispiel dafür vor, dass mit Statistik alles bewiesen werden kann? 

Das Ziel dieses Buches ist zu vermitteln, was Statistik im 
Prinzip leisten kann, wo ihre Grenzen liegen, und wie sie sinnvoll 
eingesetzt wird. Damit sollte man am Ende dieses Buches ein- 
schätzen können, ob überhaupt, wo und welche statistischen Fehler 
in diesen Meldungen liegen. Dass ein solches Wissen heutzutage 
recht nützlich ist, zeigt der Blick auf nicht nur diese Zeitungsmel- 
dungen. Aber auch die meisten sozialwissenschaftlichen Artikel 
sind heutzutage nicht ohne statistische Grundkenntnisse lesbar. 
Wesentliche Erkenntnisfortschritte auch in den Sozialwissenschaf- 
ten sind den formalen und statistischen Methoden zuzurechnen. 

Viele Studierende haben sich aber vielleicht auch deshalb für 
die Sozialwissenschaften entschieden, weil sie keine große Begeis- 
terung für Formeln und Mathematik aufbringen können. In diesem 
Buch wird deshalb versucht, insbesondere mathematische Ablei- 
tungen und Beweise weitgehend zu vermeiden. Formeln und ihre 
Anwendung und Umformung zu verstehen, ist jedoch unbedingt 
notwendig. 



1.2 Was ist Statistik nicht? 

Um einen ersten Eindruck davon zu gewinnen, wo die Grenzen 
von Statistik sind, sei zunächst einiges benannt, wofür Statistik 
nicht zuständig ist. 

Statistik ist keine Datensammlung. D.h. die Daten selbst, wie 
auch immer gesammelt, sind noch keine Statistik. 

Sie ist kein Verfahren, das beliebige Ergebnisse erzeugt. Im 
Gegenteil soll hier gerade deutlich werden, wie man aus Daten 
falsch abgeleitete Behauptungen erkennen kann. 

Sie ist ebenso keine Methode, wie man gute Messungen 
durchführt oder eine richtige Versuchsanordnung aufbaut, d.h. 
wie man Daten wissenschaftlich sammelt. 

Es folgt ein Beispiel, das auch später noch Verwendung finden 
wird: Jugendliche wurden befragt: „In jeder Gesellschaft gibt es 
unterschiedliche Vorstellungen darüber, welche Eigenschaften und 
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Verhaltensweisen von Menschen wünschenswert sind und welche 
nicht. Sage mir bitte jetzt, wie wichtig für Dich die folgenden 
Eigenschaften sind. Nenne mir bitte eine Bewertung zwischen 7 
und 1. 7 bedeutet dabei, dass es für Dich sehr wichtig ist, und 1, 
dass es überhaupt nicht wichtig ist. Wie wichtig ist für Dich per- 
sönlich, ,sein Leben zu genießen“?“ (Shell-Jugendstudie 1997:81). 

Die meisten Jugendlichen kreuzten hier eine 7 = sehr wichtig 
an. Einige Forscher haben daraus gefolgert, dass die heutige Ju- 
gend eine Fun-Generation ist, die den Lebenssinn nur noch darin 
sieht, Spaß zu haben. Ob diese Folgerung richtig ist oder nicht, 
dazu kann Statistik nichts beitragen. Statistik beginnt erst dann, 
wenn solche Befragungen durchgeführt worden sind. Die Konzep- 
tion von Befragungen und der Sinn und Unsinn von solchen Fra- 
gen kann nicht der Statistik angelastet werden, sondern fällt in den 
Bereich der empirischen Sozialforschung. 



1.3. Welche Funktion hat Statistik? 

Die Frage, was nun Statistik ist, kann vielleicht dadurch beantwor- 
tet werden, welche Funktionen sie erfüllt. Zunächst kann man 
feststellen, dass Statistik eine von einer speziellen Anwendung 
unabhängige Wissenschaft ist; sie ist rein logisch begründet. Das 
ist der Grund, warum die Statistik nur dann für falsche Erkenntnis- 
se verantwortlich gemacht werden kann, wenn die statistischen 
Berechnungen logisch falsch durchgeführt worden sind. 

Statistik hat deshalb fachübergreifende Bedeutung, weil sie für 
alle Wissenschaften, die sich mit realen Erscheinungen befassen, 
also alle außer Theologie, Philosophie und Mathematik, das 
Hilfsmittel ist, um zwei wichtige Probleme in den Griff zu be- 
kommen. Alle diese Wissenschaften haben nämlich bei der Erfas- 
sung der Realität mit zwei zentralen Schwierigkeiten zu kämpfen: 

1. Wenn man dasselbe Merkmal an vielen Untersuchungsobjek- 
ten beobachtet, ist es meist im Detail unterschiedlich, weil es 
in der Realität fast nie identische Objekte gibt. Will man etwa 
mit den Antworten der Jugendlichen auf die obige Frage fest- 
stellen, ob Mädchen oder Jungen genusssüchtiger sind, so be- 
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obachtet man sowohl bei Mädchen als auch bei Jungen Ant- 
worten von gar nicht wichtig bis sehr wichtig. Das Merkmal, 
wie wichtig jemandem der Lebensgenuss ist, ist also sowohl 
bei Mädchen als auch bei Jungen sehr variabel. Man benötigt 
also ein Instrument, um diese Variabilität in einer Weise zu 
beschreiben, die es ermöglicht, Unterschiede dieses Merkmals 
trotz seiner Variabilität festzustellen. Dieses Instrument muss 
also irgendwie eine geeignete Zusammenfassung aller Beo- 
bachtungen zur Verfügung stellen. 

2. Aus Zeitmangel kann man nicht alle Objekte, über die man 
wissenschaftliche Aussagen machen will, beobachten. Eine 
Wissenschaftlerin, die eine allgemeine Behauptung aufstellen 
will, ist also gezwungen, diese Behauptung mit einer kleineren 
Anzahl von Beobachtungen zu begründen, als die Gesamtheit 
darstellt, auf die sich ihre Behauptung bezieht. Viele haben 
schon selbst Behauptungen aufgestellt über „die Männer“ oder 
„die Deutschen“. Sie mussten sich dabei auf die Kenntnis der 
wenigen Menschen mit diesen Eigenschaften, die sie selbst 
kennen, stützen. Deshalb weiß jeder von der Unsicherheit sol- 
cher Verallgemeinerungen. 

Das wissenschaftliche Verfahren für eine solche Verall- 
gemeinerung heißt „Induktion“. Die Philosophie hat nachge- 
wiesen, dass Induktionsschlüsse in Bezug auf reale Objekte 
logisch gesehen generell falsch sind. Für die Wissenschaft 
stellt sich deshalb das Problem, ein Instrument zu benötigen, 
das diesen Schluss von einigen Beobachtungen auf alle mögli- 
chen Objekte absichern kann. Denn nur dann, wenn eine in- 
duktive Verallgemeinerung nach einem wissenschaftlichen, 
nachprüfbaren Verfahren erfolgen kann, das einige Sicherheit 
bietet, können empirische Beobachtungen zum Beweis oder 
zur Widerlegung von Hypothesen verwendet werden. Man 
benötigt also ein Verfahren, das erstens vorschreibt, wie die 
Merkmale, die an einigen Objekten beobachtet worden sind, 
für alle Objekte geschätzt werden sollen und das zweitens die 
Unsicherheit, mit der diese Schätzung behaftet ist, auf einen 
Begriff bringt. 
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Die Statistik stellt nun genau für diese zwei Probleme Lösungen 
bereit. 



1.4. Einteilung der Statistik 

Welche Bereiche der Statistik werden in diesem einführenden 
Buch behandelt? Die Statistik wird in zwei große Bereiche einge- 
teilt, die jeweils eines dieser beiden Probleme bearbeiten: 

1 . die deskriptive Statistik 

2. die Inferenzstatistik. 

Die deskriptive Statistik behandelt das Problem der Zusam- 
menfassung von Beobachtungen. Dabei werden vor allem folgende 
Methoden verwendet: die Ordnung aller Beobachtungen und die 
Darstellung dieser Ordnung in Tabellen, die Darstellung aller Beo- 
bachtungen in Form von Grafiken, und die Berechnung von Kenn- 
zahlen (Parametern), die die Gesamtheit aller Beobachtungen 
kennzeichnen. Diese Kennzahlen sollten einfach zu berechnen 
sein, eine anschauliche Bedeutung haben und in einer noch näher 
zu bestimmenden Weise optimal sein. Ein Beispiel für eine solche 
Kennzahl ist der Durchschnitt aus allen Beobachtungen. So kann 
man das Problem, ob Mädchen oder Jungen genusssüchtiger sind, 
dadurch mit Statistik lösen, dass der Durchschnitt der Antworten 
auf die obige Frage sowohl für Mädchen als auch für Jungen ge- 
trennt berechnet wird und die beiden Werte verglichen werden. 
Die Antwort ist, dass hier nur ein sehr geringer Unterschied be- 
steht. 

Die Inferenzstatistik behandelt das Problem der Verallgemei- 
nerung von Beobachtungen. Die wesentliche Grundlage dafür ist 
die Wahrscheinlichkeitstheorie. Der zentrale Punkt ist, dass mit 
dieser Theorie Wahrscheinlichkeiten für die Richtigkeit von 
Schätzungen angegeben werden können. Wenn man aus einigen 
Beobachtungen Aussagen über die Allgemeinheit treffen will, 
kann man angeben, mit welcher Wahrscheinlichkeit diese Verall- 
gemeinerung richtig ist. Durch diesen Trick wird erreicht, dass die 
logische Unmöglichkeit, Sicherheit bei induktiven Schlüssen zu 
erreichen, nicht grundsätzlich Verallgemeinerungen verhindert. 
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Eine induktive Schätzung bleibt zwar grundsätzlich unsicher, aber 
man kann nun versuchen, eine möglichst hohe Wahrscheinlichkeit 
dieses Schlusses zu erreichen und damit eine möglichst sichere 
Verallgemeinerung zu treffen. So kann man im obigen Beispiel 
angeben, dass sich Mädchen und Jungen mit 99,9%iger Sicherheit 
nicht in der Frage des Lebensgenusses unterscheiden. Bei anderen 
Fragen, etwa danach, wie wichtig es ist, anderen zu helfen oder auf 
andere Rücksicht zu nehmen, unterscheiden sich Mädchen und 
Jungen dagegen mit 99,9%iger Sicherheit. Diese Methodik der 
Statistik bedeutet einen großen Fortschritt für die Möglichkeit der 
Verallgemeinerung von Beobachtungen. Erst mit dieser Methode 
macht es überhaupt Sinn, Stichproben zu nehmen, um daraus 
Rückschlüsse auf die Allgemeinheit zu ziehen. 

Die Objekte, die die empirische Sozialwissenschaft beobach- 
tet, sind in den meisten Fällen Menschen und ihre sozialen Verhal- 
tensweisen. Erst seit der Mitte des 20. Jahrhunderts haben sich die 
statistischen Methoden auch in den Sozialwissenschaften durchge- 
setzt. Vorher herrschte die Meinung vor, dass es gänzlich unmög- 
lich sei, allgemeine Aussagen über Menschen auf statistischer 
Basis treffen zu können. So schreibt der französische Sozialfor- 
scher LePlay 1855: „Noch weniger glücklich sind die Statistiker 
bei solchen Untersuchungen gewesen, die sich speziell auf die 
innere Natur des Menschen beziehen, ... auf den Vergleich der 
moralischen und intellektuellen Eigenschaften und allgemeiner, 
auf die Elemente, die man betrachten muss, wenn man die Lage 
der arbeitenden Bevölkerung ermitteln will. Die Ursachen dieser 
Unfähigkeit sind klar: Die offiziellen Resultate, die sich auf die 
Gesamtheit eines Landes erstrecken, beziehen sich auf gewisse 
Punkte, welche die Staatsgewalt interessieren, abstrahieren aber 
von allen Punkten, die diese Frage nur berühren; sie rechnen weder 
mit der besonderen Natur des Individuums, noch mit dem Milieu, 
in dem es lebt; ...Zusammengefasst, die Methode der Statistiker ist 
nicht die der Beobachtung direkter Tatsachen;...“ (zitiert nach 
Kern: 53). 

Die Gründe dafür, die LePlay hier nennt und die auch heute 
noch oft genannt werden, lassen sich auf zwei wesentliche Tatsa- 
chen bündeln. Es ist 1. die Vielfältigkeit und Einmaligkeit mensch- 
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licher Verhaltensweisen. Und 2. das Phänomen, dass soziale Be- 
ziehungen nicht wie etwa in der Physik auf mechanischen Kräften, 
sondern auf Kommunikation beruhen. Diese Tatsachen bringen für 
die Datenerhebung sozialer Daten große Probleme mit sich. Diese 
Probleme konnten erst mit Hilfe der Ergebnisse der modernen 
Statistik behandelt werden. Am obigen Beispiel kann man sehen, 
wie diese Probleme heute angegangen werden. Die Vielfältigkeit 
und Einmaligkeit der individuellen Lebenseinstellung der heutigen 
Jugendlichen wird eingeebnet, indem allen dieselbe Frage gestellt 
wird. Die komplexe soziale Verhaltensweise „Lebenseinstellung“ 
wird auf eine Reihe spezieller Fragen reduziert. Das ist einerseits 
eine erhebliche Reduktion des Problems. Andrerseits gewinnt man 
dadurch die Möglichkeit, eben diese statistischen Methoden anzu- 
wenden, die es ermöglichen, nur 2000 Jugendliche zu befragen 
und die Resultate auf alle Jugendlichen in Deutschland zu verall- 
gemeinern. 

Ein weiteres Kriterium, nach denen die Statistik eingeteilt 
wird, ist die Unterscheidung in univariate und multivariate Verfah- 
ren. In der Frage des Beispiels, ob ein Unterschied zwischen Mäd- 
chen und Jungen in der Wichtigkeit des Lebensgenusses besteht, 
sind schon zwei Merkmale der Personen beteiligt: das Merkmal 
Geschlecht und das Merkmal „wie wichtig findet es diese Person, 
das Leben zu genießen?“. Wenn man mehrere Merkmale zusam- 
men untersucht, kann man Zusammenhänge zwischen Merkmalen 
feststellen. Eine weitere Hauptaufgabe der Statistik ist, solche 
Zusammenhänge zwischen Merkmalen zu beschreiben und zwar 
wieder a) deskriptiv in der Form von Tabellen, Grafiken und 
Kennzahlen, und b) mit Inferenzstatistik zu bestimmen, ob diese 
Zusammenhänge verallgemeinerbar sind. Sind mehr als zwei 
Merkmale zusammen zu untersuchen, spricht man von „multivari- 
ater Statistik“. Bei drei und mehr Variablen tauchen spezielle 
Probleme auf, die die statistische Behandlung besonders erschwe- 
ren. 

Damit kann schon etwas genauer angegeben werden, wann 
und warum Statistik bei der Erforschung eines sozialen Problems 
eingesetzt wird. Sie kommt zur Anwendung, wenn die Daten erho- 
ben oder die Beobachtungen gemacht worden sind, in der Phase 
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der Auswertung der Daten. Sie dient als Hilfsmittel für zwei Zwe- 
cke: 

1. zur Durchdringung der gesammelten Daten mit Hilfe der Zu- 
sammenfassung der darin enthaltenen Informationen. 

2. zur Hilfe bei der Verallgemeinerung der erhaltenen Aussagen. 

Obwohl Statistik eine Hilfswissenschaft ist, ist sie notwendig. 

Denn erstens ist es unmöglich, größere Datenbestände und kom- 
plexere Beziehungen zwischen mehreren Merkmalen rein verbal 
zu beschreiben. Die Alltags-Sprache ist dafür nicht konzipiert, sie 
ist zu vieldeutig, hat zu wenig logische Wendungen und ist zu 
wenig komplex. 

Die zweite Funktion der Statistik, den Induktionsschluss zu 
ermöglichen, ist aber die eigentliche, gerade für die Sozialwissen- 
schaften besonders wichtige Leistung. Denn insbesondere in den 
Sozialwissenschaften kommt es oft vor, dass interessante Phäno- 
mene nicht wiederholbar sind. Man kann dabei an Prozesse denken 
wie die Erziehung eines Menschen, die ein etwa 20 Jahre währen- 
des nicht wiederholbares Experiment darstellt, das die sozialen 
Verhaltensweisen eines Erwachsenen bestimmt. Oder daran, dass 
sich jede Person wegen des Lerneffektes in der gleichen Situation 
zum zweiten Mal anders verhält. Deshalb kann eine Forscherin 
einen sozialen Prozess nicht wie in der Physik beliebig oft wieder- 
holen, bis sie das genaue Ergebnis herausbekommen hat. Um etwa 
die Resultate von Erziehungsprozessen zu untersuchen, geht man 
deshalb so vor, dass man denselben Erziehungsprozess an unter- 
schiedlichen Personen untersucht. „Wir haben es hier also mit 
zwei Alternativen zu tun: entweder ,an einem Objekt mehrmals* 
oder ,an verschiedenen Objekten einmal*“ (Sixtl 1993:3) Beobach- 
tungen machen. Mit Hilfe der Wahrscheinlichkeitsrechnung kann 
nun die zweite Vorgehens weise einen gleichrangigen Ersatz für 
die erste Methode darstellen, die eigentlich die klassische experi- 
mentelle Methode ist. Die Statistik wird deshalb besonders für die 
Sozialwissenschaften wegen ihres Problems der Unwiederholbar- 
keit vieler interessanter Phänomene wichtig. 

In diesem Buch wird nur univariate und bivariate Statistik 
betrieben. Die multivariate Statistik gehört in den Kurs Statistik II. 
Ebenso wird hauptsächlich deskriptive Statistik vermittelt. Da 
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jedoch die Möglichkeit der Verallgemeinerung empirischer Beo- 
bachtungen ganz grundlegend für alle Wissenschaft ist, wird eben- 
falls in die Grundzüge der Inferenzstatistik eingeführt. Das bedeu- 
tet aber, dass elementare Anfänge der Wahrscheinlichkeitstheorie 
behandelt werden müssen. Dieses Gebiet wird aber auf den Teil 
der sog. Konfidenzintervalle beschränkt. Auch die Test-Theorie, 
die das statistische Testen von Hypothesen beinhaltet, wird im 
wesentlichen Teil von Statistik II sein und in diesem Buch nur 
ganz kurz angerissen werden können. 




Kapitel 2: Sozialwissenschaftliche Datensammlun- 
gen 



Wenn ein soziales Problem erforscht werden soll, werden Daten 
über dieses Problem erhoben. Sehr nützlich für die Erforschung ist 
es, wenn z.B. Daten aus früheren oder parallelen Forschungen zum 
selben Problem vorhanden sind. Dann können diese Daten mit den 
eigenen verglichen werden und daraus die eigenen Ergebnisse 
besser eingeschätzt werden. Neben den speziellen Daten eines 
Forschungsprojekts gibt es darüber hinaus soziale Umstände, die 
in fast jedem sozialwissenschaftlichen Forschungszusammenhang 
eine Rolle spielen und deshalb in fast jedem Projekt benötigt wer- 
den. Dazu gehören z.B. die Berufstätigkeit und das Einkommen, 
die soziale Schichtung, das politische Verständnis, die Familiensi- 
tuation usw. Es ist deshalb ebenfalls sehr nützlich, wenn über diese 
übergreifenden sozialen Fragen regelmäßig aktuelle Daten vor- 
handen sind und bei einer zentralen Stelle gelagert werden. 

Das größte öffentlich zugängliche Archiv für Daten der Sozi- 
alforschung in der Bundesrepublik ist das „ZA - Zentralarchiv für 
Empirische Sozialforschung an der Universität zu Köln". Es wurde 
1960 u.a. von Erwin Scheuch und Günther Schmölders gegründet. 
Das ZA ist Mitglied in der 1986 gegründeten „GES1S - Gesell- 
schaft sozialwissenschaftlicher Infrastruktureinrichtungen e.V.“ 
( www.social-science-gesis.de ), deren Träger Bund und Länder 
sind. Neben dem ZA sind in der GESIS das „IZ - Informations- 
zentrum Sozialwissenschaften“ aus Bonn, und das „ZUMA- Zent- 
rum für Meinungen, Umfragen und Analysen“ in Mannheim Mit- 
glieder. Eine vergleichbar wichtige sozialwissenschaftliche Daten- 
bank außerhalb der GESIS existiert nur noch in Berlin, nämlich die 
Unterabteilung „SOEP- Sozio-ökonomisches Panel“ ( www.diw- 
berlin.de/soep/ ) des DIW- Deutschen Instituts für Wirtschaft. 

Einzelne Forschergruppen können heute nur selten Daten in 
einem solchen Umfang erheben, dass die daraus gewonnenen Er- 
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gebnisse Rückschlüsse auf ganz Deutschland zulassen. Deshalb ist 
eine weitere Hauptaufgabe dieser Institute, regelmäßig Umfragen 
zu sozial wissenschaftlich relevanten Tatbeständen durchzuführen, 
die für ganz Deutschland repräsentativ sind und von allen interes- 
sierten Sozialwissenschaftlerlnnen genutzt werden können. Auf 
diese Weise können auch Studierende in die Lage kommen, mit 
qualitativ hochwertigen und repräsentativen Daten zu arbeiten, für 
deren Erhebung und Bereitstellung ein Forschungsprojekt Jahre 
benötigt hätte. 

Einige der wichtigsten und regelmäßig erhobenen Datenbe- 
stände dieser Institute sind die folgenden: 

• ALLBUS - Allgemeine Bevölkerungsumfrage Sozialwissen- 
schaften. Seit 1980 wird diese Umfrage in Zwei-Jahres- 
Abständen erhoben. Auftraggeber ist ZUMA. Befragt werden 
im Schnitt 3000-3500 Personen aus allen Bundesländern. 

• Politbarometer. Das „Politbarometer“ ist vielleicht aus dem 
ZDF bekannt. Durchgeführt wird es in etwa monatlichen Ab- 
ständen von der Forschungsgruppe Wahlen e.V. in Mannheim. 
Befragt werden 1300-1400 Personen, seit 1988 mit telefoni- 
schen Befragungen. 

• Eurobarometer. Auftraggeber ist das Direktorat für Informati- 
on der EU-Kommission. Ziel der Befragung ist der Vergleich 
der sozialen Bedingungen in den verschiedenen EU-Ländern. 
Deshalb werden dieselben Fragen in allen EU-Ländern ge- 
stellt. Befragt werden 1000 Einwohner pro Land. Erhebungs- 
zeiten seit 1973 halbjährlich jeden Frühling und Herbst. 

• Shell - Jugendstudien. Auftraggeber sind das Deutsche Ju- 
gendinstitut und die Shell AG. Befragt werden ca. 2500 Ju- 
gendliche von 12-24 Jahren zu ihren Zukunftserwartungen. 
Bisher wurde die Befragung 1981, 1986, 1992, 1997 und 
2002 durchgeführt. 

Mit diesen und weiteren regelmäßigen Befragungen ist im Prinzip 
ein Projekt eingerichtet worden, das den Namen „Dauerbeobach- 
tung der Gesellschaft“ verdient, wie es auch von ZUMA selbst 
genannt wird. In diesen Erhebungen werden soziale und politische 
Kernbereiche der Gesellschaft ständig erfasst und die Ergebnisse 
sowohl zur Verfügung gestellt, als auch in verschiedenen Veröf- 
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fentlichungen statistisch ausgewertet publiziert. Die bekannteste 
Publikation ist vielleicht das jährlich erscheinende Buch „Datenre- 
port“, das das Statistische Bundesamt herausgibt. Es beruht in den 
sozialstatistischen Teilen auf der Zusammenarbeit des Statisti- 
schen Bundesamtes mit ZUMA und dem Wissenschaftszentrum 
Berlin ( www.wz-berlin.de). 



Tabelle 2.1: Einige sozialwissenschaftliche Trenddatenbestände 





Erhoben von 


Seit 


Wieder- 

holung 


Be- 

frag- 

te 


Design 


ALLBUS 


ZUMA 


1980 


2-jährig 


3500 


Trend/Quer- 

schnitt 


Politba- 

rometer 


Forschungs- 
gruppe Wah- 
len 


1977 


monat- 

lich 


1300 


Trend/Panel 


Euroba- 

rometer 


EG-Kommis- 

sion 


1973 


halb- 

jährlich 


1000 

pro 

Land 


Trend/Quer- 

schnitt 


Jugend- 

studie 


Shell, Deut- 
sches Jugend- 
institut 


1981 


5-, oder 
3- jährig 


2500 


Querschnitt 



Der Vorteil, den regelmäßige Wiederholungen von Umfragen 
bieten, ist die Möglichkeit, die Veränderung bestimmter sozialer 
Gegebenheiten im Zeitverlauf zu verfolgen. Jede einzelne dieser 
Erhebungen zu einem bestimmten Zeitpunkt stellt eine sog. „Quer- 
schnittsanalyse“ dar: ein Querschnitt durch die soziale Lage der 
Bevölkerung zu dem Erhebungszeitpunkt. Verfolgt man eine be- 
stimmte Fragestellung in ihrer Veränderung im Zeitverlauf, so 
spricht man von einer „Längsschnitt“- bzw. „Trendanalyse“. 

Alle obigen Umfragen sind im Prinzip als Trenddatensätze 
aufgebaut, beinhalten aber zu speziellen Problemen auch immer 
Fragen, die nur zu einem Zeitpunkt, d.h. in einem speziellen Jahr 
gestellt wurden. 
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Ein wesentlicher Unterschied in der Anlage von regelmäßig 
stattfindenden Umfragen ist der Umstand, ob dieselben Personen 
befragt werden oder jeweils andere. Werden immer dieselben 
Personen befragt, spricht man von „Panel“-Daten bzw. einer „Pa- 
nel“-Analyse. Panel-Erhebungen bringen beträchtliche empirische 
und methodische Probleme mit sich. Das SOEP ist die weltweit 
größte und längste Panelstudie; einige Tausend Befragte wurden 
seit 1984 wiederholt von der SOEP-Gruppe befragt. 

Alle anderen Studien befragen jeweils andere ausgewählte 
Personen, so dass jede Studie zu jedem Zeitpunkt eine Quer- 
schnittsanalyse darstellt. Die Frage stellt sich sofort, ob etwa die 
Einkommenswerte aus der Studie des vorigen Jahres mit den Ein- 
kommenswerten aus der Studie heute verglichen werden können, 
wenn doch ganz verschiedene Personen befragt worden sind. Ge- 
nau diese Frage kann wiederum mit den Methoden der Inferenzsta- 
tistik beantwortet werden. 

Von einer repräsentativen Studie erwartet man weiter, dass ih- 
re Ergebnisse ohne große Fehler auf das gesamte Erhebungsgebiet, 
also die ehemalige oder jetzige Bundesrepublik, übertragen wer- 
den können. Die Frage, wie viele Personen man befragen muss, 
damit man einen solchen induktiven Schluss auf das Gesamtgebiet 
machen kann, wird wiederum durch die Inferenzstatistik beantwor- 
tet. Man sieht hier die Antwort: die Erhebungen haben Größen von 
mind. 1300 bis zu 3500. Man kann aber auch schnell die Grenzen 
dieser Zahlen ausrechnen: wenn man etwa von 100.000 gewaltbe- 
reiten Rechtsextremen unter 60 Millionen Erwachsenen in der 
BRD ausgeht, werden bei 3000 Befragten etwa 5 solche Rechtsex- 
treme in die Stichprobe gelangen. Mit dieser Anzahl Daten kann 
also keine Untersuchung über Teilgruppen dieser Größenordnung 
mehr durchgeführt werden. 

Die Themenspektren dieser Befragungen sind einerseits unter- 
schiedlich je nach dem Interesse der Auftraggeber, andererseits 
auch ähnlich bis hin zu gleich lautenden Fragen in den Bereichen, 
die die soziodemografischen Grunddaten der Befragten darstellen. 
Die spezifischen Schwerpunkte der fünf hier dargestellten Erhe- 
bungen sind die folgenden: 
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Der ALLBUS verfolgt das allgemeine Ziel, den sozialen 
Wandel in der BRD zu erfassen. Dazu werden sowohl soziale 
Merkmale breit erfasst, die die materielle Stellung der Befragten 
kennzeichnen, wie Berufsausübung, Mitgliedschaften, materielle 
Versorgung mit Gütern, als auch solche Merkmale, die die sozia- 
len Einstellungen und Werte, Meinungen, Hoffnungen und Ängste 
beinhalten, wie Lebenszufriedenheit, Umweltsorgen, Kriminali- 
tätsfurcht oder Demonstrationsbereitschaft. 

Die Politbarometer verfolgen das Ziel, die kurzfristigen Ver- 
änderungen der politischen Einstellungen in der BRD lückenlos zu 
erfassen. Die Sonntagsfrage und die Beliebtheitsskalometer für die 
Spitzenpolitiker sind dafür typische Fragen. Weiter wird das politi- 
sche Verständnis auch tiefer hinterfragt, um etwa die Verankerung 
demokratischen Gedankenguts oder das Verständnis für die euro- 
päische Einigung in der Bevölkerung zu erfassen. 

Die Eurobarometer sind vor allem am Vergleich der Lebens- 
umstände in den Ländern der EU interessiert. Dabei stehen bei 
jeder Erhebung andere Themen im Vordergrund: mal die politi- 
schen Einstellungen, mal die Gesundheitsversorgung, mal die 
Arbeitsbedingungen usw. Die Fragen werden zunächst zweispra- 
chig englisch-französisch konzipiert und dann in jede Landesspra- 
che übersetzt. 

Die Jugendstudien richten ihr Interesse auf die Einstellungen 
von Jugendlichen und ihre Lage in ihren Familien. Die Zukunfts- 
hoffnungen und das zu erwartende Engagement sowie die Proble- 
me der Jugendlichen sollen erfasst werden, um festzustellen, wie 
weit die heutige Erwachsenenwelt und ihr Nachwuchs voneinander 
entfernt sind, z.B. in der Studie von 1997, inwieweit Jugendliche 
noch politisches Engagement besitzen oder vermehrt an sich selbst 
interessiert sind. 

Die Fragen, die in fast allen Untersuchungen Vorkommen, sind 
z.B. die nach Geschlecht, dem Alter, der Konfession, dem Ein- 
kommen, dem Familienstand, dem Bildungsstand, dem Beruf. Man 
spricht von der sog. Standard-Demographie. Diese Merkmale sind 
u.a. deshalb in fast jeder dieser Umfragen enthalten, weil sie we- 
sentliche Unterscheidungsmerkmale der sozialen Struktur unserer 
Gesellschaft darstellen. Es lässt sich erwarten, dass Personen aus 
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unterschiedlichen Bereichen dieser sozial-demografischen Struktur 
in allen anderen zu untersuchenden Bereichen ebenfalls Unter- 
schiede aufweisen. So kann man annehmen, dass sich Männer und 
Frauen z.B. in ihren Meinungen zu speziellen sozialen und politi- 
schen Fragen unterscheiden, oder dass sich Städter und Dorfbe- 
wohner in vielen Bereichen ihres Lebensstils unterscheiden. Eben- 
so ist zu erwarten, dass sich die soziodemografische Struktur ins- 
gesamt im Vergleich der europäischen Länder unterscheidet und 
so mit unterschiedlichen kulturellen Verhältnissen verbunden ist. 

Tabelle 2.2: Standard-Demografie ( ALLBUS ) 



Standard-Demografie (ALLBUS) 


Geschlecht 


Geburtsmonat, -jahr und Alter 


Familienstand 


Schulbildung 


Ausbildungsabschluß 


Beruf und Berufsstellung 


Einkommen 


Haushaltsgröße 


regionale Herkunft 


Wohnungstyp 


Wohnortsgröße und -typ 


Konfession, Religiosität 


Mitgliedschaft in Gewerkschaft oder Partei 


Wahlabsicht (Sonntagsfrage) 


Beruf des Vaters/der Mutter 



In allen diesen Massendatensätzen wird mit standardisierten Fra- 
gen gearbeitet. Das bedeutet, dass die Antwortmöglichkeiten auf 
die Fragen vorgegeben sind. Der einfachste Zugang zu diesen 
Daten besteht darin, sich die verschiedenen Antwortmöglichkeiten 
auf die einzelnen Fragen anzusehen und festzustellen, wie oft sie 
gegeben wurden. In dieser Weise sind auch in den sog. „Codebü- 
chern“, den Anleitungen zum Lesen der Datensätze im Computer, 
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alle Fragen ausgewertet. In einigen Fällen stehen diese primären 
Ergebnisse der Befragung auch im Internet zur Verfügung, so 
beim Eurobarometer und beim sozioökonomischen Panel. Als 
Beispiel folgt ein Auszug aus dem Eurobarometer (im Internet: 
über die GESIS - Adresse zu erreichen) 

Tabelle 2.3: Ausschnitt aus dem Eurobarometer 



VAR 50 Q8 EU MEMBER - GOOD/BAD 



Q.8 Generally speaking, do you think that (OUR COUNTRY'S) 
membership of the European Union is ...? (READ OUT) 



9556 1. A good thing 4023 2. Neither good nor bad 
2616 3. A bad thing 23 0. NA 948 4. DK 

F B NL D-W I L DK IRL GB NIRL GR 

1 541 701 807 623 773 400 538 784 442 191 632 

2 296 231 121 241 154 60 224 119 287 69 235 

3 126 91 59 119 57 25 220 47 258 16 92 

0020 7 00 200 00 

4 39 31 23 65 73 14 16 50 79 29 47 



E P D-E N FIN S A 

1 445 456 540 384 490 398 411 

2 292 340 350 190 291 210 313 

3 216 132 67 352 182 338 219 

0 0 0 6 5 0 1 0 

4 47 72 86 69 67 70 71 




Kapitel 3: Skalenniveau 



3.1 Daten, Merkmale, Variable 

Statistische Auswertung baut auf Daten auf, die aus Beobachtun- 
gen gewonnen werden. Man kann dazu auch sagen, dass sie auf 
„Messungen“ beruhen. Als erstes müssen deshalb einige Begriffe 
definiert werden, mit denen der Messvorgang und die Daten weiter 
genauer beschreibbar sind. 

Eine Beobachtung oder ein Messvorgang bringt drei Dinge 
zusammen: man ordnet einem Objekt bzgl. einer Eigenschaft ein 
bestimmtes Adjektiv oder einen bestimmten Wert zu, z.B. „Meine 
Freundin hat blaue Augen“. Beobachtetes Objekt ist die Freundin, 
Eigenschaft ist ihre Augenfarbe, und der Wert ist blau. Jedes wis- 
senschaftliche Datum ist durch diese drei Dimensionen gekenn- 
zeichnet, für die leider mehrere Bezeichnungen gebräuchlich sind. 
Welche Bezeichnung genommen wird, ist eigentlich gleich; sie 
hängt jedoch auch von dem Zusammenhang ab, in dem die Daten 
verwendet werden. 



Tabelle 3.1: Begriffe zur Beschreibung von Forschungsobjekten 



Alltagssprache 


Wissenschaft 


Statistik, 

Datenauswertung 


Objekt 


Untersuchungsein- 
heit, Merkmalsträger 


Fälle 

(„cases“) 


Eigenschaft 


Merkmal 


Variable 

(„variables“) 


bestimmte Eigen- 
schaft 


Ausprägung des 

Merkmals 


Wert 

(„values“) 



Alle diese Begriffe werden häufig benutzt, es ist wichtig zu wis- 
sen, dass sie z.T. dasselbe bezeichnen. Die einzige Schwierigkeit 
besteht in der Alltagssprache, in der es keine klare Unterscheidung 
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zwischen Merkmalen und ihren Ausprägungen gibt: „blaue Au- 
gen“ wird direkt als Eigenschaft angesehen, da das Merkmal „Au- 
gen“ bei einem Objekt „Mensch“ im Alltag nicht als besonders 
erwähnenswert erscheint; es wird erst dadurch zum Merkmal, dass 
die Augenfarbe von einem Forscher als beobachtenswertes Merk- 
mal von Menschen zum Forschungsgegenstand erhoben wird. 

Die drei Dimensionen von Beobachtungen lassen sich gut in 
einer Tabelle darstellen. Die folgende Tabelle erfasst die Merkma- 
le Augenfarbe und Geschwisterzahl für eine Reihe von namentlich 
unterschiedenen Personen: 



Tabelle 3.2: Beispiel einer Rohdaten-Matrix 





Augen 


Geschwister 


Müller 


braun 


keine 


Meier 


blau 


2 


Schulze 


grün 


3 


Schmidt 


braun 


1 


... 







Eine solche Tabelle wird oft auch Matrix genannt. Eine Matrix ist 
ein zweidimensionales Zahlenschema. Jedes Element x des Sche- 
mas lässt sich durch die zwei Angaben „Zeile“, „Spalte“, die als 
Index geschrieben werden, in der Matrix lokalisieren: x^ ist das 
Element in der i-ten Zeile und der j-ten Spalte. 



Tabelle 3.3: Aufbau einer Matrix 



X 11 


x 12 


x 13 


X M 




X 21 


x 22 


x 23 


x 24 




X 31 


x 32 


x 33 


X34 















In genau dieser Weise ist auch grundsätzlich die „Datenmatrix“ in 
fast allen EDV- Auswertungsprogrammen aufgebaut. Sie heißt 
auch „Rohdatenmatrix“. In einer Rohdatenmatrix bilden die Fälle 
die Zeilen und die Variablen die Spalten der Matrix. Als Beispiel 
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ist in Tabelle 3.4 eine Rohdatenmatrix des ALLBUS 1994 im 
Statistik - Programm SPSS dargestellt. 

Tabelle 3.4: Datenmatrix des ALLBUS 1994 in SPSS (Ausschnitt) 



|[?IF1 $2140 - SPSS für Windows Daten-Editof 



Dalei Bearbeiten Ansicht Daten Transformieren Analysieren Grafiken Extras Fenster hilfe 

Bg|H|aim I IMc?l W Eläüi~^l<a>l 



7:v15 0 





vl 


v2 


□ 




□ 


□ 


□ 




□ 














1 


2140 


4 


n 


D 


n 


13 


13 


13 


13 


5 


5 


1 


1 


3 


1 


2 


2140 


6 














n 


7 


4 


4 


2 


B 


■ 


3 


2140 
















z 


6 


B 


1 


1 


2 


m 


4 


2140 


8 














2 


3 


6 


1 


1 


2 




5 


2140 


9 














3 


3 


5 


1 


1 


m 




6 


2140 


10 














1 


4 


3 


1 


1 




m 


7 


2140 


11 














7 


5 


6 


2 


1 






8 


2140 


12 














c 


6 


6 


1 


1 




_L 


9 


2140 


13 














1 


5 1 


1 


3 




m 


10 


2140 


14 














e 


3 


5 


1 


1 






11 


2140 


15 














4 


4 


5 


1 


1 






12 


2140 


16 














c 


3 


5 


1 


1 


m 


m 


13 


o 

IN 


17 














7 


6 


7 


1 


1 


2 


L 


14 


2140 


18 














2 


4 


2 


1 


2 


2 


L 


15 


2140 


19 


n 






13 


13 


D 


e 


5 


6 


1 


1 


3 


m 


16 


2140 


20 


_L 


JL 


5 


2 


2 


3 


1 


4 


3 


2 


2 


1 


i 



Wie man sehen kann, werden die Merkmale, hier die Fragen des 
ALLBUS - Fragebogens, mit VI, V2, V3, usw. (in den Spalten- 
köpfen) bezeichnet. Die Fälle, die befragten Personen, werden 
durchnummeriert (Zeilenanfänge). 

3.2 Skalenniveaus 



Es gibt nun Unterschiede in den möglichen Eigenschaften von 
sozialwissenschaftlichen Objekten, wie man am Beispiel oben 
(Tabelle 3.2) schon sehen kann: in der ersten Spalte stehen Worte, 
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in der zweiten Zahlen. Sie sind deshalb sehr wesentlich, weil sie 
bestimmen, welche statistischen Methoden anzuwenden sind. 
Diese Unterschiede durchziehen deshalb das gesamte Buch. 

Man unterscheidet zunächst qualitative und quantitative 
Merkmale. Das bedeutet, dass ihre Ausprägungen qualitativ oder 
quantitativ sind. Quantitativ sind Ausprägungen dann, wenn sie in 
irgendeiner Weise Zahlen sind. Zum Beispiel: die Anzahl der 
Leser dieses Buches, die Anzahl der Kinder in einer Familie, das 
Alter in Jahren, das Einkommen, die Punktezahlen, die jemand in 
der Abschlussklausur erzielt usw. Qualitativ sind Ausprägungen, 
die keine Zahlen darstellen. Zum Beispiel das gewählte Studien- 
fach, die Konfession, der Schulabschluss, die Haarfarbe, die be- 
vorzugte Musikrichtung usw. 

Es ist nun allerdings möglich, qualitativen Merkmalen Zahlen 
zuzuordnen, indem man einfach eine Vorschrift entwickelt. Man 
kann etwa bestimmen: männlich = 1, weiblich = 2. Oder katholisch 
= 1, evangelisch = 2, andere Religion = 3, keine Religion = 4. 
Dieser Vorgang heißt „Codierung“. 



Definition : „Messen“ eines qualitativen Merkmals besteht in 
seiner „Codierung“ (= Zuordnung von Zahlen). 



Eine weitere Unterteilung ist die in „ diskrete “ und „ stetige “ 
(auch „ kontinuierliche “) Merkmale. Ein diskretes Merkmal besitzt 
nur endlich viele oder höchstens abzählbar viele Ausprägungen. 
Beispiele wären die Kinderzahl einer Frau, die Berufe, die es gibt 
(man kann sie abzählen, da jede Person nur ein paar haben kann 
und es endlich viele Menschen gibt), das Geschlecht, die Augen- 
zahl beim Würfeln mit einem oder mehreren Würfeln usw. Das 
Geschlecht besitzt nur zwei Ausprägungen. Solche Merkmale 
heißen auch dichotom. Dichotome Variable spielen in einigen 
statistischen Verfahren eine besondere Rolle. 

Ein stetiges Merkmal kann im Prinzip unendlich viele Ausprä- 
gungen annehmen. Es kann dabei auch insgesamt beschränkt sein, 
wenn nur zwischen diesen Grenzen beliebig viele Werte möglich 
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sind. Beispiele wären die Körpergröße, das Einkommen, die Dauer 
einer Ehe, die Zahl der Studierenden in der Bundesrepublik etc. 

Am letzten Beispiel sieht man, dass die Übergänge fließend 
sind: man könnte auch den Standpunkt vertreten, dass die Zahl der 
Studierenden ein diskretes Merkmal ist, weil es nur endlich viele 
sein können. Es sind aber so viele, nämlich 1,8 Millionen, dass 
hier sehr feine Unterteilungen möglich sind. 

Es bestehen folgende Beziehungen zwischen diesen Unter- 
scheidungen: im Allgemeinen sind qualitative Merkmale diskret 
und quantitative Merkmale stetig. Es gibt aber für beide Beziehun- 
gen Gegenbeispiele: Farben sind qualitativ, können aber durch die 
Angabe der physikalischen Frequenz des Lichts stetig beschrieben 
werden, und die Kinderzahl etwa ist ein quantitatives Merkmal, 
das jedoch diskret ist. 

Wie am Beispiel der Konfession gezeigt wurde, kann man 
qualitativen Merkmalen Zahlen zuordnen: evangelisch = 1, katho- 
lisch = 2. Mit Zahlen kann man nun alle möglichen mathemati- 
schen Operationen durchführen, z.B. addieren 1+2 = 3. Offenbar 
macht diese Operation für die codierte Konfession keinen Sinn, 
denn das würde bedeuten: 

katholisch + evangelisch = sonstige Religion 
Wenn man Daten Zahlen zuordnet, muss man also darauf achten, 
welche Operationen mit diesen Daten möglich sind. Der Begriff, 
der einen Zahlenbereich zusammen mit einer solchen Einschrän- 
kung der Möglichkeiten des Rechnens mit Zahlen bezeichnet, ist 
„Skala“. 



Definition'. Eine Skala ist eine Codierung, die die Eigenschaf- 
ten des Merkmals berücksichtigt. 



Je nach der Art der Relation, in der Zahlen stehen können, unter- 
scheidet man vier verschiedene Typen von Skalen: Nominalskala, 
Ordinalskala, Intervallskala und Rationalskala. Die Unterschiede 
bestehen in den möglichen Interpretationen der Daten, sowohl 
sprachlich als auch mathematisch. Daraus ergeben sich ebenfalls 
Hinweise, ob und wie man die Codierung der Daten verändern 







36 



darf, die sog. „erlaubten Transformationen“ bzw. „erlaubte Umco- 
dierungen“ (s. Tabelle 3.5). 

Die Skalentypen heißen auch Messniveaus. Die Messniveaus 
sind ebenfalls wie eine Ordinalskala geordnet: Nominalskala ist 
das niedrigste, Rationalskala das höchste Skalenniveau. Das be- 
deutet, ein Merkmal, das intervallskaliert ist, ist auch automatisch 
ordinal- und nominalskaliert, aber ein Merkmal, das ordinalskaliert 
ist, ist generell nicht intervallskaliert. Wenn man ein Merkmal hat, 
muss man also zunächst das maximal mögliche Messniveau für 
diese Variable bestimmen, bevor man anfängt, damit statistisch zu 
rechnen. 



Tabelle 3.5: Die unterschiedlichen Skalentypen 



Skalenty- 
pen, Mess- 
niveaus 


erlaubte 
Vergleiche 
von Aus- 
prägungen 


erlaubter 
Vergleich 
von Wer- 
ten 


erlaubte 

Umcodie- 

rungen 


Beispiele 


Nominal- 


Ausprä- 


a = b ? 


eineindeu- 


Konfession, 


skala 


gungen 


a*b? 


tige 


bevorzugte 




sind gleich 




Transfor- 


Musikrich- 




oder ver- 




mationen 


tung, 




schieden 






Nationalität 


Ordi- 


Ausprä- 


a < b? 


monotone 


Schulab- 


nalskala 


gungen 


a < b ? 


Transfor- 


schluss, 




sind größer. 


a > b ? 


mationen 


Bundesliga- 




kleiner oder 


a > b ? 




tabelle, 




gleich 


a = b? 




Uni-Ranking 


Intervall- 


Differenzen 


a-b=c-d ? 


lineare 


Intelligenz- 


skala 


von Aus- 




Transfor- 


test, 




prägungen 




mationen 


Skala von 1 = 




sind ver- 




x‘ = bx + 


„sehr wich- 




gleichbar 




c 


tig“ bis 7 = 










„unwichtig“ 


Rational- 


Vergleich 


a/b=c/d ? 


proportio- 


Einkommen, 


skala 


von Ver- 




nale 


Ausbildungs- 




hältnissen, 




Transfor- 


zeit, 




Prozentan- 




mationen 


Ehedauer 




teilen 




x' = bx 
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Das Rationalskalenniveau ist vom Intervallskalenniveau da- 
durch unterschieden, dass die Zahl Null eine allgemeine inhaltliche 
Bedeutung hat. (0 = kein Einkommen, 0 = nicht verheiratet, 0 = 
keine Ausbildungsjahre). Ordinalskaliert bedeutet, die Ausprägun- 
gen besitzen eine konsistente Ordnung: wenn Ausprägung A vor 
Ausprägung B kommt und Ausprägung B vor Ausprägung C 
kommt, dann muss Ausprägung A auch vor Ausprägung C kom- 
men (das sog. Transitivitätsaxiom). Beispiel: der Hauptschulab- 
schluss gilt als weniger wert als der Realschulabschluss, der Real- 
schulabschluss als weniger wert als Abitur: dann muss Hauptschu- 
le auch weniger wert sein als Abitur. Nominalskalierte Daten kann 
man beliebig umcodieren. Beispiel Konfession: man kann genauso 
gut 1 = katholisch und 2 = evangelisch codieren. 

In allen Naturwissenschaften und auch in der Ökonomie, in 
der sehr viele Variablen in Geldeinheiten umgerechnet werden 
können, haben die meisten Merkmale, mit denen man es zu tun 
hat, Rationalskalenniveau. Nicht so in den Sozialwissenschaften, 
hier muss man immer erst feststellen, welchen Skalentyp die 
Merkmale haben, für die man sich interessiert. Da vom Skalentyp 
die erlaubten Rechenoperationen abhängen, ist einsichtig, dass 
davon auch die erlaubten statistischen Auswertungsmethoden 
abhängen. 

Für praktische Arbeiten am Computer werden die Skalentypen 
noch weiter zusammengefasst in nur zwei Kategorien: Nominal- 
und ordinalskalierte Daten heißen nicht-metrische oder kategoriale 
Daten, intervall- und rationalskalierte Daten heißen metrische 
Daten. 

Die Unterteilung der Skalentypen mag etwas technisch er- 
scheinen. Sie ist jedoch eine immer noch zwischen Statistikern, 
Empirikern und Wissenschaftstheoretikern diskutierte Frage. Hin- 
ter ihr steht letztlich das Problem, ob alle sozialen Erfahrungen in 
Zahlen darstellbar sind. Im obigen Beispiel aus dem Jugendsurvey 
wird „Lebensgenuss“ zu einer intervallskalierten Variablen ge- 
macht, indem die Wichtigkeit des Lebensgenusses auf einer 
gleichmäßig unterteilten Skala von 1 bis 7 verortet wird. Damit 
wird z.B. unterstellt, dass jeder Jugendliche die Wichtigkeit von 
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Lebensgenuss stufenlos einschätzen kann und dass ein Unterschied 
in der Wichtigkeit von Lebensgenuss von Stufe 3 auf 4 genauso 
groß ist wie der von Stufe 6 auf 7. 

Die Entscheidung, welches Messniveau für einen komplizier- 
ten sozialwissenschaftlichen Begriff wie etwa „Lebensgenuss“ 
angemessen ist und wie er deshalb gemessen werden sollte, kann 
nicht aus dem Inhalt des Begriffs oder der Art der Messung abge- 
leitet werden. Das Messniveau kann im Prinzip empirisch ermittelt 
werden, wofür es aber wenig Verfahren gibt und was selten ge- 
macht wird. Im Allgemeinen wird das Messniveau durch die An- 
schauung bestimmt. Diese Problematik ist jedoch Teil der empiri- 
schen Sozialforschung. Hier in diesem Buch wird davon ausge- 
gangen, dass diese Probleme geklärt sind und das Skalenniveau 
der Daten den dahinterstehenden Eigenschaften der Personen an- 
gemessen ist. 



Weitere Literatur zu diesem Kapitel: Clauß u.a.: 16-21, Hochstäd- 
ter: 13-21, Krämer, Kühnel/Krebs: 28-36 

Übungsaufgaben : 

1. Bestimmen Sie für folgende Merkmale das Skalenniveau: a) 
Konfession (Auspr.: evangelisch / katholisch / andere), b) Tem- 
peraturwert auf der Celsius-Skala, c) Postleitzahlen, d) Schulno- 
te (Auspr.: 1 - 6), e) Schuhgröße, f) Entfernung in km, g) Ge- 
schlecht, h) Zahl der in einem Haushalt lebenden Personen 

2. Geben Sie zu jedem der folgenden Merkmale je zwei unter- 
schiedliche Möglichkeiten von Ausprägungen an und charakte- 
risieren Sie die jeweilige Art der Ausprägung (quantita- 
tiv/qualitativ, diskret/stetig). 

a.) Einkommenssituation, b) Vorbereitungsintensität für eine 
Prüfung, c) Gehgeschwindigkeit, d) Tabakkonsum 




Kapitel 4: Häufigkeiten 



4.1. Urlisten und Rohdaten 

Am Anfang jeder Auswertung steht eine Liste von Daten, die im 
Forschungsprozess erhoben worden sind, die sog. „Urliste“ oder 
die „Rohdaten“. 



Definition : Urliste oder Rohdaten sind die auszuwertenden 
Daten in der Form, wie sie nach der Datenerhebung vorliegen. 
Dimensionen der Urliste sind die Fälle einer Population (ca- 
ses), Merkmale (variables) und die Ausprägungen (values, 
Kategorien) der Merkmale. 



Tabelle 4.1: Beispiele für Rohdaten, ihre Fälle, Merkmale und 
Ausprägungen 



Fälle in der Popula- 
tion 


Merkmal 


Ausprägungen 


Ausgefüllte Frage- 
bögen 


Frage im Fragebo- 
gen 


angekreuzte Ant- 
wort 


mündl. interviewte 
Personen 


Frage des Intervie- 
wers 


Antwort des Be- 
fragten 


Texte 


Beurteilungskrite- 
rien: z.B. Inhalt, 
Länge, Stil 


Art des Inhalt, Zahl 
der Worte, ... 


Beobachtete Objek- 
te, z.B. Menschen 
im Lokal 


Beobachtete Aktivi- 
täten, z.B. trinken, 
sich unterhalten 


Intensität der Hand- 
lung, z.B. Anzahl 
Biere, Anzahl der 
Gesprächspartner, 
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Die Ausprägungen werden oft in Zahlen dargestellt, d.h. codiert. 
Aus den Urlisten werden die Daten in eine Tabelle in der Weise 
eingetragen, dass die Fälle untereinander und die Merkmale ne- 
beneinander stehen. Dadurch wird die „Rohdatenmatrix“ aufge- 
spannt, die oben beschrieben wurde. Voraussetzung für statisti- 
sche Auswertung ist: jeder Fall besitzt in Bezug auf jedes Merkmal 
nur genau eine Ausprägung. 

Um sich in den Rohdaten zurechtzufinden, werden meist fol- 
gende Bezeichnungen verwendet. 



Bezeichnungen: 

X bezeichnet ein Merkmal. Wenn das Merkmal kategorial ist, 
bezeichnet X k die k-te Ausprägung des Merkmals. X k = evange- 
lisch bedeutet dann, dass „evangelisch“ den Code k bekommen 
hat. 

Mit x t wird die Ausprägung des i-ten Falls bzgl. des Merkmals 
X bezeichnet. Xj = X k bedeutet also, dass der i-te Fall die k-te 
Ausprägung besitzt. 

Beispiel: X = Konfession, Xi = evangelisch, X 2 = katholisch; x ; 
= 2 heißt: Fall i ist katholisch. 

Wenn das Merkmal stetig ist, schreibt man x, = X, wobei X für 
den Wert des i-ten Falls steht. 

Beispiel: X = Kinderzahl, x ; = 2, oder X = Einkommen, x, = 
4762,39 Euro. 

Die Gesamtzahl der Fälle eines Datensatzes wird mit N oder n 
bezeichnet. 



4.2. Häufigkeitsverteilungen 

Die Verfahren, die im Folgenden dargestellt werden, stellen den 
Anfang jeder Art statistischer Auswertung dar. Sie verschaffen 
einen möglichst differenzierten Einblick darüber, wie ein bestimm- 
tes Merkmal in einer Population verteilt ist. Verteilt sein heißt 
dabei, mit welcher Häufigkeit die Ausprägungen des Merkmals 
jeweils Vorkommen. 
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Definition : Die Häufigkeitsverteilung (auch kurz „Verteilung“) 
eines Merkmals ist die Darstellung seiner Ausprägungen im 
Verhältnis ihres Auftretens in den Fällen. 



Um eine Häufigkeitsverteilung eines Merkmals X zu konstruieren, 
wird eine Tabelle angelegt, in der die einzelnen Ausprägungen und 
die Anzahl ihres Auftretens, d.h. die Zahl der Fälle mit dieser 
Ausprägung, festgehalten werden. Die absolute Häufigkeitsvertei- 
lung eines Merkmals bezeichnet man dann mit f(X). Die Häufig- 
keit der Ausprägung k eines kategorialen Merkmals X ist dann 
f(X k ) (f für engl, frequency). 

Beispiel. Die 20 Rohdaten bestehen aus den Codierungen der Zu- 
stimmung zur Meinung: „Soziale Unterschiede sind gerecht“, mit 
den Werten 1 = stimme voll zu, 2 = stimme eher zu, 3 = stimme 
eher nicht zu, 4 = stimme gar nicht zu (V168 ALLBUS 1998): 

4, 3, 3, 2, 3, 1,4, 4, 3, 3, 3, 2, 2, 4, 3, 4, 2, 3, 2, 4 

Die Häufigkeitstabelle besteht dann zunächst aus den ersten beiden 
Spalten der folgenden Tabelle: 



Häufigkeitsverteilung V168 



Soziale Unter- 
schiede gerecht? 


Absolute 

Häufigkeit 

f(X) 


Relative 

Häufigkeit 

P(X) 


Prozentuale 

Häufigk. 

%(X) 


Stimme voll zu 
(Code 1) 


1 


1/20 = 0,05 


5,0 


Stimme eher zu 
(Code 2) 


5 


5/20 = 0,25 


25,0 


Stimme eher nicht 
zu (Code 3) 


8 


8/20 = 0,4 


40,0 


Stimme gar nicht 
zu (Code 4) 


6 


6/20 = 0,3 


30,0 


Insgesamt 


N = 20 


1, 000 


100,00 



Dabei stellt sich eine erste Schwierigkeit ein: bei Merkmalen mit 
nominalem oder ordinalem Skalenniveau kann man die linke Spal- 
te sofort hinschreiben, bei Maßzahlen mit metrischem Skalenni- 
veau jedoch müssen Zusammenfassungen vorgenommen werden, 
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um in der linken Spalte nicht genauso viele Ausprägungen wie 
Fälle zu erhalten. Für das Merkmal „Einkommen“ derselben Per- 
sonen z.B. müssen sinnvoller Weise die metrischen Antworten 
zusammengefasst werden zu einer Handvoll Kategorien, den sog. 
Messwertklassen. 

Seien die Rohdaten für das Einkommen der oben befragten 
Personen die folgenden: 

900, 1600, 800, 2300, 1300, 2700, 2100, 2500, 4000, 1700, 3300, 
1400, 1900, 1480, 2900, 1200, 1150, 600, 4100, 2700. 

Hier ist der Minimalwert der Angaben 600. Bildet man dann z.B. 
Messwertklassen von 1000, sieht die Häufigkeitsverteilung wie 
folgt aus: 



Häufigkeitsverteilung „Einkommen“ (lOOOer-Klassen) 



Alter 


Absolute 

Häufigkeit 

f(Y) 


Relative 

Häufigkeit 

P(X) 


Proz. Häu- 
figkeit 

% 


0 bis unter 1000 


3 


3/20 = 0,15 


15,0 


1000 bis unter 2000 


8 


8/20 = 0,4 


40,0 


2000 bis unter 3000 


6 


6/20 = 0,3 


30,0 


3000 bis unter 4000 


1 


1/20 = 0,05 


5,0 


4000 bis unter 5000 


2 


2/20 = 0,1 


10,0 


Insgesamt 


N = 20 


1,0 


100,0 



Wenn man jedoch nur 3 Klassen „Arme“, „Mittlere“ und „Reiche“ 
bildet, die man forschungspragmatisch festgelegt hat, kann man zu 
folgender Häufigkeitstabelle kommen: 



Häufigkeitsverteilung „Einkommen“ (3 Messwertklassen) 



Alter 


Absolute Häu- 
figkeit f(Y) 


Relative Häu- 
figkeit p(Y) 


Proz. Häufig- 
keit % 


„Arme“ (= 
unter 1500) 


8 


8/20 = 0,4 


40,0 


„Mittlere“ (= 
1500-3000) 


9 


9/20 = 0,45 


45,0 


„Reiche“ (= 
über 3000) 


3 


3/20 = 0,15 


15,0 


Insgesamt 


N = 20 


1,000 


100,0 
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Offenbar geht bei der Zusammenfassung von metrischen Variablen 
zu Messwertklassen ein gewisses Maß an Information, das die 
Daten beinhalten, verloren, das sich in der Beliebigkeit der Zu- 
sammenfassung ausdrückt. Dieser Verlust kann übrigens hochpoli- 
tisch sein: er macht z.B. in der Diskussion um die Zusammenfas- 
sung von Wahlkreisen bei Verkleinerungen des Parlaments die 
Brisanz aus. Liegen Daten nur in der Form von Messwertklassen 
vor, spricht man von „gruppierten Daten“. Wenn in einer Veröf- 
fentlichung nur gruppierte Daten veröffentlicht sind, ist deshalb 
Vorsicht angebracht; es kann sich bei einer anderen Gruppierung 
ein unterschiedliches Bild der Verteilung ergeben. Eine feinere 
Unterteilung ist übrigens immer vorzuziehen. 



Definition : Bei einer Zusammenfassung von Ausprägungen zu 
Gruppen heißen diese Messwertklassen und die sich daraus 
ergebenden Daten gruppierte Daten. 



Will man nun zwei verschiedene absolute Häufigkeitstabellen 
miteinander vergleichen, so scheitert das meist daran, dass die 
Gesamtzahl N der Fälle unterschiedlich groß ist. Deshalb werden 
die absoluten Häufigkeiten so umgerechnet, dass sie normiert sind. 
Dazu gibt es zwei weitere Möglichkeiten der Darstellung der Häu- 
figkeiten: die relative und die prozentuale Häufigkeit. Die relative 
Häufigkeit ist die absolute Häufigkeit geteilt durch die Gesamtzahl 
der Fälle und wird auch als „Anteil“ bezeichnet, die prozentuale 
Häufigkeit ist die relative Häufigkeit multipliziert mit 100. Wenn 
die Gesamtzahl der Fälle N ist, dann gilt: 



Definition : Sei f(X) die absolute Häufigkeit einer Merk- 

malsausprägung, dann ist 

p(X) = f(X) /N die relative Häufigkeit (auch Anteil) und 
%(X) = p(X) 100 die prozentuale Häufigkeit. 



In den beiden obigen Tabellen ist ebenfalls die relative und 
prozentuale Häufigkeit dargestellt. Um eine Kontrolle darüber zu 
haben, ob richtig gerechnet worden ist, sollten immer die Summen 
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über die verschiedenen Häufigkeiten berechnet werden. Deshalb 
ist bei jeder Tabelle unbedingt immer eine „Insgesamt“ - Zeile 
hinzuzufügen! Es gilt 

£f(Xk) = N, ^p(X k )= 1,0, ^%(X k )= 100,0 
allek alle k allek 



Exkurs: 

Definition des Summenzeichens am Beispiel: 

Sei X ein Merkmal mit 4 Kategorien k, die mit „1“, „2“, „3“ 
und „4“ bezeichnet sind. Die Häufigkeitstabelle bestehe aus f(l) 
= 3, f(2) = 7, f(3) = 4, f(4) = 6. Anzahl Fälle sei N = 20 

^ f(k) = f(l) + f(2) + f(3) + f(4) = 3 + 7 + 4 + 6 = 20 = N 

k=t234 



Die Häufigkeitsverteilung enthält - für nicht-gruppierte Daten 
- die maximale statistische Information über dieses einzelne 
Merkmal, mehr kann man darüber nicht wissen. An Hand der 
Häufigkeitsverteilung kann man schon erste Vermutungen über die 
Daten anstellen. So sieht man an der Häufigkeitsverteilung oft, in 
welchem Bereich die meisten Ausprägungen liegen; weiter kann 
man erkennen, ob alle Ausprägungen etwa gleichviel angenommen 
werden oder ob im anderen Extremfall eine einzige Ausprägung 
fast alle Fälle umfasst. 

Die Hauptaufgabe der Statistik kann man dahingehend be- 
schreiben, die Häufigkeitsverteilungen von Merkmalen zu kenn- 
zeichnen und in Beziehung zu setzen: 





45 



Aufgaben der Statistik: 

• Die Häufigkeitsverteilung durch möglichst wenige Kenn- 
zahlen, sog. Parameter, ausreichend zu beschreiben. 

• Die Häufigkeitsverteilung mit bekannten mathematisch- 
theoretisch hergeleiteten Verteilungen zu vergleichen. 

• Die Häufigkeitsverteilungen zweier oder mehrerer Merk- 
male - u.a. mit Hilfe ihrer Kennzahlen - daraufhin zu ver- 
gleichen, ob die Merkmale in irgendeiner Weise miteinan- 
der verkoppelt sind. 



Deshalb ist die Häufigkeitsverteilung als Tabelle oder Grafik Be- 
standteil jeder statistischen Auswertung, weil sie den ersten und 
umfassendsten Überblick über ein Merkmal verschafft. 



4.3. Kumulierte Häufigkeiten 

Die absoluten Häufigkeiten können noch in einer anderen Weise 
dargestellt werden, in der sog. kumulierten Häufigkeit. 



Definition: Die kumulierte Häufigkeitsverteilung F gibt zu 
jedem Wert der Merkmalsausprägung an, wie viele Fälle kleiner 
oder gleich diesem Wert sind. 



Man schreibt die kumulierte Verteilung mit großem F. So ergibt 
sich für einen Wert a eines diskreten Merkmals X: 



F(a) = Z f(X). 

X<a 

An der Definition wird deutlich, dass die kumulierte Häufigkeit für 
nominale Daten keinen Sinn hat, da dort die Relation „<“ (kleiner) 
nicht definiert ist. 

Zur Berechnung der kumulierten Häufigkeit des obigen ersten 
Beispiels führt man die Kumulation erst für die absoluten Zahlen 
durch und berechnet dann den relativen Wert. 
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Kumulierte Häufigkeitsverteilung Y168 



Soziale Unter- 
schiede gerecht? 


Absolute 

Häufigkeit 

f(X) 


Kumulierte 

absolute 

Häufigkeit 


Kumulierte 
relative Häu- 
figkeit L(X) 


Stimme voll zu 
(Code 1) 


1 


1 


1/20 = 0,05 


Stimme eher zu 
(Code 2) 


5 


1 + 5 = 6 


6/20 = 0,3 


Stimme eher 
nicht zu (Code 3) 


8 


6 + 8= 14 


14/20 = 0,7 


Stimme gar nicht 
zu (5) 


6 


14 + 6 = 20 


1,0 


Insgesamt 


N = 20 







Definition : Die Funktion F der kumulierten relativen Häufig- 
keiten heißt auch Verteilungsfunktion des Merkmals. Sie hat 2 
Eigenschaften: 

1. Ihre Werte liegen zwischen 0 und 1. 

2. Sie wächst monoton von 0 auf 1 . 



Der Begriff der Verteilung hat nunmehr zwei unterschiedliche 
Bedeutungen, die aber strikt miteinander Zusammenhängen, näm- 
lich einmal die Häufigkeitsverteilung und zum anderen die kumu- 
lierte Verteilungsfunktion. Genauer ist es so, dass der Zusammen- 
hang zwischen beiden für metrische Variable genau der der Diffe- 
rentiation ist. Die Häufigkeitsverteilung ist die erste Ableitung der 
Verteilungsfunktion. 

Tabelle 4.2 zeigt, wie Häufigkeitstabellen in der Statistik- 
Analyse von SPSS aussehen (V168 in ALLBUS 98, USCLASS8 
im GSS = General Social Survey der USA 1984). 
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Tabelle 4.2: Häufigkeitstabelle in SPSS 



SOZIALE UNTERSCHIEDE SIND GERECHT 





Häufigkeit 


Prozent 


Gültige 

Prozente 


Kumulierte 

Prozente 


Gültig STIMME VOLL ZU 


169 


5,2 


5,5 


5,5 


STIMME EHER ZU 


652 


20,2 


21,2 


26,7 


STIMME EHER NICHT ZU 


1133 


35,0 


36,8 


63,5 


STIMME GAR NICHT ZU 


1123 


34,7 


36,5 


100,0 


Gesamt 


3077 


95,1 


100,0 




Fehlend WN 


150 


4,6 






KA 


7 


,2 






Gesamt 


157 


4,9 






Gesamt 


3234 


100,0 







SOCIAL DIFFERENCES ARE ACCEPTABLE 





Häufigkeit 


Prozent 


Gültige 

Prozente 


Kumulierte 

Prozente 


Gültig STRONGLY AGREE 


120 


,4 


8,6 


8,6 


SOMEWHAT AGREE 


631 


1,9 


45,4 


54,1 


SOMEWHT DISAGREE 


474 


1,5 


34,1 


88,2 


STRNGLY DISAGREE 


164 


,5 


11,8 


100,0 


Gesamt 


1389 


4,3 


100,0 




Fehlend NAP 


30907 


95,5 






NO OPINION 


58 


,2 






NA 


26 


,1 






Gesamt 


30991 


95,7 






Gesamt 


32380 


100,0 







Die Prozentuierung wird zweimal vorgenommen, einmal mit den 
„fehlenden Werten“ (WN = weiß nicht, KA = keine Angabe, NAP 
= no answer possible, NA = no answer) und einmal ohne. Wichtig 
zu wissen ist, dass SPSS keine Zusammenfassung in Messwert- 
klassen bei intervallskalierten Daten vornimmt, sondern alle ein- 
zelnen Werte in der Tabelle aufführt. 

Wie man an der Spalte der kumulierten Werte leicht ablesen 
kann, bestehen bei dieser Meinung erhebliche Unterschiede zwi- 
schen der BRD und den USA: Deutsche lehnen sie zu 73,3% ab, 
US-Amerikaner stimmen ihr zu 54,1% zu. 
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4. 4. Grafische Darstellung der Häufigkeitsverteilung eines 
Merkmals 

Es bietet sich an, die Häufigkeitsverteilung eines Merkmals gra- 
fisch darzustellen. Die grafische Darstellung von Verteilungen ist 
mittlerweile sehr weit verbreitet, insbesondere in den Medien. 
Dabei werden oft Fehler gemacht, die teilweise so groß sind, dass 
man an Manipulationen von Daten denken kann. Grafiken sind 
aber deshalb besonders gut geeignet, weil sie eine Menge von 
Informationen in einem Bild zusammenziehen können und so mit 
einer Grafik oft mehrere Tabellen oder eine Menge Text ersetzt 
werden können. 

Um Fehler bei der grafischen Darstellung zu vermeiden, sollte 
man sich an einige Grundprinzipien halten. Die Grafiken sollten 
übersichtlich und verständlich sein, 
ausreichend gekennzeichnet sein, 

mathematisch genaue Umsetzung von Zahlen in grafische 
Objekte darstellen. 

Die meisten Grafiken stellen in irgendeiner Weise Häufigkeitsver- 
teilungen dar. Sie sind deshalb zweidimensional. Ihnen unterliegt 
also in den meisten Fällen ein Achsenkreuz mit zwei Achsen. 
Welche der beiden Dimensionen auf den Achsen dargestellt sind, 
sollte grundsätzlich gleich gehandhabt werden. Es gibt deshalb ein 
Grundprinzip dafür: 

die Ausprägungen des Merkmals stehen auf der Abszisse 
(horizontale Achse, X-Achse) 

die Häufigkeiten jeder Ausprägung stehen auf der Ordinate 
(vertikale Achse, Y -Achse) 

Die Darstellungsformen unterscheiden sich nun genau nach den 
Unterschieden des Skalentyps der Daten. Kategoriale Daten haben 
andere Darstellungsformen als metrische Daten. Die einfachste 
Form bei den kategorialen Daten ist das Balkendiagramm. 



Definition'. Ein Balkendiagramm ist eine Darstellung einer 
Häufigkeitsverteilung von nominalen Daten in Säulenform, wo- 
bei sich die Säulen nicht berühren. 
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Das Balkendiagramm soll andeuten, dass es sich auf der Abszisse 
um Ausprägungen von Daten handelt, die nicht in irgendeiner 
Weise aneinander anschließen. Das ist z.B. bei Konfession der 
Fall. Deshalb sollte ein Spalt zwischen den Balken bestehen blei- 
ben (s. Abb. 4.1; Konfession = Frage V321 in ALLBUS 94). 



1200 ' 




ROEMISCH-KATHOLISCH KEINER RELIGIONSGEM. 

EVANG.OHNE FREIKIRCH 



KONFESSION, BEFRAGTE<R> 



Abbildung 4.1: Balkendiagramm „Konfessionszugehörigkeit“ 



Definition : Ein Histogramm ist eine Darstellung einer Häufig- 
keitsverteilung von ordinalen oder gruppierten Daten in Säulen- 
form, wobei die Säulen aneinander anschließen. Ein Polygon- 
zug verbindet die Mitten eines Histogramms. 



Im Fall der Antworten auf die Frage nach der Gerechtigkeit sozia- 
ler Unterschiede jedoch schließen die Antworten aneinander an, so 
dass ein Histogramm angebracht ist. Ebenfalls stellt man bei grup- 
pierten Daten, d.h. nach einer Messwertklassenbildung, bei der 
metrische Werte eingeteilt wurden, die Säulen direkt anschließend 
nebeneinander, um anzudeuten, dass der größte Wert der einen 
Säule und der kleinste Wert der nächsten Säule direkt aneinander 
anschließen. Als Beispiel das Histogramm der Altersverteilung in 
Abbildung 4.2 (V247 in ALLBUS 94). 
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23,0 33,0 43,0 53,0 63,0 73,0 83,0 93,0 

ALTER: BEFRAGTE<R> 



Abbildung 4.2: Histogramm der Altersverteilung in 10-Jahres-Messwertklassen 



Um zu verdeutlichen, dass es sich um metrische Daten handelt, 
kann man ebenfalls einen so genannten Polygonzug als Darstel- 
lungsform wählen. Das ist eine geschlossene Kurve, die jeweils die 
Mitte der Säulenspitzen verbindet. 




ALTER 1 0-Jahres-Klassen 

Abbildung 4.3: Altersverteilung in 10-Jahres-Klassen als Polygonzug 
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Ein Histogramm für ein metrisches Merkmal stellt die Daten der 
Urliste in etwas verfremdeter Form dar, wie sie vorliegen. Hier ist 
entscheidend, welche Breite die jeweilige Messklasse hat. 

Im Fall der Altersverteilung kann man sogar die Rohdaten 
selbst darstellen und mit dem Histogramm vergleichen: 




21 29 37 45 53 61 69 77 85 



ALTER: BEFRAGTE<R> 
Abbildung 4.4: Altersverteilung absolut 



Das Histogramm sieht im Übrigen vollkommen gleich für alle drei 
Häufigkeitsarten (absolut, relativ oder prozentual) aus, dadurch 
ändert sich nur die Bezeichnung (Skalierung) der y- Achse. Abhän- 
gig von der Messklasseneinteilung bleibt die Form der Kurve doch 
in etwa gleich und wirkt nur verschieden grob (s. Abbildungen 4.2 
bis 4.6). Das lässt sich mathematisch dadurch erklären, dass die 
Fläche unter der Kurve immer gleich groß bleiben muss, da ja 
immer dieselbe absolute Anzahl von Fällen in verschiedener Wei- 
se aufgeteilt wird. In prozentualen Häufigkeiten gemessen, muss 
die Fläche unter den verschiedenen Messklasseneinteilungen im- 
mer 100%, bzw. in relativen Häufigkeiten gemessen, immer genau 
1.0 ergeben. Bei Einteilung in Messwertklassen ungleicher Breite 
muss das im Histogramm berücksichtigt werden! 
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2000 ' 




ALTER: BEFRAGTE<R> 

Abbildung 4.5: Altersverteilung mit nur 3 Messklassen 



Beim Alter handelt es sich hier immer noch um diskrete Da- 
ten, aber man kann sich vorstellen, dass das Alter noch feiner ge- 
messen wird. Dann geht der Polygonzug über in eine stetige Funk- 
tion zwischen Ausprägungen und Häufigkeit. 



100 




18 30 42 54 66 81 



ALTER: BEFRAGTE<R> 

Abbildung 4.6: „Dichtefunktion“ der Altersverteilung und relative Häufigkeit einer 
Messwertklasse 
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Mit der Annahme von unendlich vielen Daten heißt eine solche 
Funktion „Dichtefunktion“. Die Fläche unter einer solche Funktion 
ist dann ebenfalls = 100% bzw. als relative Fläufigkeit gemessen = 
1,0. Bei Vorhandensein einer solchen Funktion kann die relative 
Häufigkeit für eine beliebige Messwertklasse angegeben werden: 
es ist der Wert der Fläche unter der Dichtefunktion innerhalb der 
Grenzen der Messwertklasse. 

Eine solche Dichtefunktion stellt praktisch nicht mehr einen 
Datensatz, der ja immer nur endlich sein kann, sondern ein dahin- 
ter liegendes Prinzip dar, wie jeder endliche Datensatz dieses 
Merkmals im Prinzip verteilt sein müsste. Dichtefunktionen spie- 
len später deshalb eine Rolle für theoretische Verteilungen, die in 
der Inferenzstatistik benötigt werden, (s. Kap. 7.4). 

Die kumulierte Häufigkeit, die ja nur Sinn macht für mindes- 
tens ordinalskalierte Daten, zeichnet man immer als Funktion, d.h. 
als durchgehender Linienzug, also Polygonzug. Bei metrischen 
Daten kann man dabei leicht alle einzelnen Fälle in der Darstel- 
lung berücksichtigen. Man zeichnet nicht mehr die kumulierten 
Häufigkeiten einzelner Messklassen, sondern einen Linienzug, der 
bei jedem vorkommenden Wert um so viel steigt, wie Fälle dafür 
stehen. 




ALTER: BEFRAGTE<R> 



Abbildung 4.7: absolute kumulierte Verteilungsfunktion des Alters 
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Alle bis jetzt entwickelten Begriffe wie Häufigkeitsverteilung, 
Verteilungsfunktion, Dichtefunktion usw. werden später in ganz 
analoger Weise wieder verwendet, um nicht empirisch ermittelte 
Datensätze, sondern aus mathematischen Formeln theoretisch 
abgeleitete Verteilungen, insbesondere Wahrscheinlichkeitsvertei- 
lungen, zu beschreiben (s. Kap. 7.2). 



4.5. Die Häufigkeitsverteilung zweier Merkmale 

Bisher wurden nur Darstellungen für ein Merkmal bzw. eine Vari- 
able behandelt, die sog. univariate Häufigkeitsverteilung. Bei em- 
pirischen Daten hat aber fast immer jeder Fall in der Population 
mehrere Merkmale: man stellt z.B. in Interviews den Befragten, 
d.h. den Fällen, mehrere Fragen, meist sogar einige hundert, oder 
beobachtet mehrere Aktivitäten gleichzeitig, oder hat für einen 
Text mehrere Auswertungskategorien. 

In welcher Weise wird die Häufigkeit zweier Merkmale 
gleichzeitig beschrieben? Als Beispiel für eine solche bivariate 
Häufigkeitsverteilung diene die Meinung der Befragten zur Ge- 
rechtigkeit der sozialen Unterschiede und ihre Einteilung oben in 
die Kategorien ..Anne'? „Mittlere“ und „Reiche“. Von diesen zwei 
kategorialen Merkmalen hat das eine 4 und das andere 3 Ausprä- 
gungen. Jeder Fall, d.h. jede Person ist damit in Bezug auf diese 
beiden Merkmale durch eine von 12 Möglichkeiten charakterisiert, 
nämlich durch die Kombination von 4 möglichen Ausprägungen 
des ersten Merkmals mit 3 möglichen Ausprägungen des zweiten 
Merkmals, denn die Anzahl k der Kombinationen zweier Merkma- 
le mit n und m Ausprägungen ist k = n m. Die jeweilige Kombina- 
tion lässt sich in der Datenmatrix (s. auch Tabelle 3.4) ablesen. 

Für die weitere Analyse muss man also den Wert von 12 abso- 
luten Häufigkeiten aus der Datenmatrix auszählen. Man stellt diese 
so dar, dass die Ausprägungen eines Merkmals in der Horizonta- 
len, die des anderen Merkmals in der Vertikalen abzulesen sind. 
Das ist eine sog. Kreuztabelle. Eine Kreuztabelle ist vor allem 
dann interessant, wenn das eine Merkmal als Ursache, das andere 
als Wirkung gedeutet werden kann, also die Ausprägungen des 
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einen Merkmals auf die Ausprägungen des anderen Merkmals 
wirken. Die Variable, die die Ursache darstellt, wird als unabhän- 
gige Variable bezeichnet, diejenige, die die Wirkung erfährt, heißt 
abhängige Variable. In einer Kreuztabelle sollten die Ausprägun- 
gen der unabhängigen Variable in den Zeilen, die der abhängigen 
Variable in den Spalten stehen. 

Beispiel: Datenmatrix und zugehörige Kreuztabelle mit Einkorn- 



men = unabhängige Variable 






Befragter 


Einkommen Soz.Unt. gerecht 




1 


900 




2 




2 


1600 




4 




3 


800 




3 




4 


2300 




2 




5 


1300 




4 




6 


2700 




2 




7 


2100 




3 




8 


2500 




3 




9 


4000 




2 




10 


1700 




3 




11 


3300 




4 




12 


1400 




4 




13 


1900 




2 




14 


1480 




3 




15 


2900 




4 




16 


1200 




3 




17 


1150 




3 




18 


600 




4 




19 


4100 




1 




20 


2700 




3 


Soziale Un- 


Stimme 


Stimme 


Stimme 


Stimme 


Summe 


terschiede 


voll zu 


eher zu 


eher 


gar nicht 




gerecht? \ 


(1) 


(2) 


nicht zu 


zu (4) 




Einkommen 






(3) 






unter 1500 


- 


1 


4 


3 


8 


1500 - 3000 


- 


3 


4 


2 


9 


über 3000 


1 


1 


- 


1 


3 


Summe 


1 


5 


8 


6 


20 
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Jede der 12 Kombinationsmöglichkeiten beider Eigenschaften 
steht genau in einer Zelle innerhalb der Kreuztabelle. Dazu gibt es 
zwei Summenspalten, in denen jeweils auf eines der beiden Merk- 
male aufsummiert wird. Diese Summenspalten heißen die „Rand- 
verteilungen“ der Kreuztabelle. Offenbar ist die Randverteilung 
eines Merkmals in einer Kreuztabelle identisch mit seiner Häufig- 
keitsverteilung als univariates Merkmal. 



Definition : Die beiden Randverteilungen einer Kreuztabelle 
sind die Häufigkeitsverteilungen jedes der beiden Merkmale 
und stehen in den jeweiligen Summenspalten. Jede Zelle in der 
Kreuztabelle enthält die Anzahl der Fälle, die die jeweilige 
Ausprägung der beiden Merkmale besitzen, durch die die Zelle 
gebildet wird. 



Eine solche Kreuztabelle bietet nun die Möglichkeit, das eine 
Merkmal im Hinblick auf die Ausprägungen des anderen Merk- 
mals zu vergleichen und damit eine Abhängigkeit des einen 
Merkmals vom anderen festzustellen. In jeder Zeile und Spalte 
steht nämlich auch eine Häufigkeitsverteilung, und zwar jeweils 
für eine bestimmte Ausprägung eines Merkmals. Also kann man 
die Einkommensgruppen in Bezug auf ihre Meinung zu den sozia- 
len Unterschieden vergleichen. Wie man sieht, nimmt die Zustim- 
mung zur Gerechtigkeit sozialer Unterschiede desto mehr zu, ein 
je höheres Einkommen die Personen haben, und die Ablehnung 
dieser Meinung nimmt bei den Gruppen mit geringeren Einkom- 
men ab. Bivariate Verteilungen stellen damit Zusammenhänge 
zwischen den beiden Variablen dar. Allerdings gibt es unter den 
Befragten auch mehr Arme und Mittlere als Reiche. Um einen 
besseren Vergleich zu bekommen, kann man deshalb wieder die 
absoluten Zahlen relativieren bzw. prozentuieren. 

Um relative oder prozentuale Häufigkeiten zu bilden, hat man 
bei einer Kreuztabelle drei Möglichkeiten: man kann auf die Ge- 
samtsumme der Fälle oder auf eine der beiden Randverteilungen 
prozentuieren. In den letzten Fällen spricht man von Zeilen- oder 
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Spaltenprozenten, je nachdem, ob die Summenspalte der Zeilen 
oder die Summenzeile der Spalten die jeweiligen 100% bildet. 
Beispiel für Zeilenprozente : die bedingte prozentuale Verteilung 
der Meinung zu sozialen Unterschieden unter der Bedingung, 
„arm“ zu sein: 



Soziale Un- 
terschiede 
gerecht? 


Stimme 
voll zu 
(1) 


Stimme 
eher zu 
(2) 


Stimme 
eher 
nicht zu 

(3) 


Stimme 
gar nicht 
zu (4) 


Summe 


Einkommen 
unter 1500 


0 


12,5 


50 


37,5 


100,0 



Beispiel für Spaltenprozente-, die bedingte prozentuale Verteilung 
der Einkommensgruppen unter der Bedingung, der Meinung gar 
nicht zuzustimmen: 



Einkommen 


Soziale Unterschiede gerecht? 
Stimme gar nicht zu (4) 


unter 1500 


50,0 


1500 - 3000 


33,3 


über 3000 


16,7 


Summe 


100,0 



Definition: Die Verteilung eines Merkmals X unter der Bedin- 
gung, dass ein anderes Merkmal Y eine bestimmte Ausprägung 
hat, heißt bedingte Verteilung von X unter Y. 



Der Vergleich der bedingten Verteilungen hilft, einen Zusammen- 
hang der beiden Variablen zu erkennen. Da in diesen Beispieldaten 
nur wenige Fälle sind, folgen hier die Daten aus dem ALLBUS 
1998 für dieselben Merkmale (V168, V318): 
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Einkorn. * SOZIALE UNTERSCHIEDE SIND GERECHT Kreuztabelle 









| SOZIALE UNTERSCHIEDE SIND GERECHT | 










STIMME 
VOLL ZU 


STIMME 
EHER ZU 


STIMME 
EHER 
NICHT ZU 


STIMME GAR 
NICHT ZU 


Gesamt 


Einkorn. 


unter 1 500 


Anzahl 

% von Einkorn. 


21 

3,6% 


99 

17,1% 


196 

33,9% 


262 

45,3% 


578 

100,0% 




1500-3000 


Anzahl 

% von Einkorn. 


45 

5,2% 


177 

20,6% 


321 

37,4% 


315 

36,7% 


858 

100,0% 




über 3000 


Anzahl 

% von Einkorn. 


13 

5,5% 


68 

28,7% 


95 

40,1% 


61 

25,7% 


237 

100,0% 


Gesamt 




Anzahl 

% von Einkorn. 


79 

4,7% 


344 

20,6% 


612 

36,6% 


638 

38,1% 


1673 

100,0% 



Der Vergleich der bedingten Verteilungen der Einkommensgrup- 
pen ergibt: Der Meinung, soziale Unterschiede seien gerecht, 
stimmen von den „Armen“ insgesamt 20,8% zu, und 79,2% lehnen 
sie ab; bei den „Reichen“ hingegen stimmen ihr insgesamt 34,2% 
zu, und 65,8% lehnen sie ab; die „Mittleren“ liegen mit ihren Wer- 
ten jeweils dazwischen. Damit wird der Zusammenhang erkenn- 
bar: Die Anteil von „Zustimmenden“ nimmt zu, je mehr Einkom- 
men die Befragten haben, und umgekehrt nimmt der Anteil der 
„Ablehnenden“ zu, je weniger Einkommen sie haben. Eine mögli- 
che Interpretation der Tabelle ist also, dass soziale Unterschiede 
für desto gerechter gehalten werden, je besser die eigene soziale 
Position in Bezug auf das Einkommen ist. 

Wenn man die Unterschiede in den bedingten Verteilungen 
verallgemeinert, kann man feststellen: Zwei Merkmale hängen 
umso stärker zusammen, je mehr sich die bedingten Verteilungen 
untereinander und von den Randverteilungen unterscheiden. Denn 
das bedeutet, dass jede Ausprägung im ersten Merkmal am häu- 
figsten mit einer bestimmten, jeweils anderen Ausprägung im 
zweiten Merkmal auftritt. Damit kann man von einem Merkmal 
aufs andere schließen. Das ist z.B. dann der Fall, wenn die Diago- 
nale (von links oben nach rechts unten, oder von links unten nach 
rechts oben) viel stärker besetzt als die anderen Zellen (zur weite- 
ren Diskussion des Zusammenhangs in Kreuztabellen s. Kap. 10 
und 11). 

Was geschieht nun, wenn es sich nicht um zwei kategoriale 
Merkmale, sondern um zwei metrische Merkmale handelt? Es ist 
klar, dass für zwei metrische Merkmale, die unendlich viele Werte 
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annehmen können, eine solche Kreuztabelle nur wieder aufgestellt 
werden kann, wenn die Ausprägungen beider Merkmale in Mess- 
wertklassen eingeteilt werden, mit dem entsprechenden Informati- 
onsverlust. Die bivariate Häufigkeitsverteilung von zwei metri- 
schen Merkmalen wird deshalb im Allgemeinen nicht in einer 
Tabelle, sondern grafisch dargestellt. 



4.6. Grafische Darstellung von bivariaten Verteilungen 

Die Darstellung unterscheidet sich wieder zwischen kategorialen 
und metrischen Merkmalen. Die häufigsten Darstellungsarten sind 
für kategoriale Daten: 

- (nur bei wenigen Ausprägungen) pro Balken weiter unterteiltes 
Balkendiagramm (s. Abb. 4.8), 

- drei-dimensionales Balkendiagramm (auch „Säulendiagramm“, 
s. Abb. 4.9), 




Einkommen 
□ bis 1500 
QU über 1500 bis 3000 
■ über 3000 



Abbildung 4.8: Gruppiertes Balkendiagramm 




Anzahl der Kinobesucher (in Mio.) 
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"Soziale Unterschiede sind gerecht" 




Abbildung 4.9: Drei - dimensionales Säulendiagramm 

für metrische Daten: 

- das Streu- bzw. Punkte -Diagramm (s. Abb. 4.10). 



Fernsehanschlussdichte und Kinobesucher pro Jahr 1962 - 1986 




Abbildung 4.10: Streudiagramm einer bivariaten Verteilung: Femsehanschlussdich- 
te und Kinobesucher pro Jahr 1962 - 1986 
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In einem Streudiagramm bildet die unabhängige Variable die x- 
Achse und die abhängige Variable die y-Achse. Analog zur Inter- 
pretation einer Kreuztabelle bei kategorialen Daten lässt sich auch 
ein Streudiagramm als Darstellung des Zusammenhangs der bei- 
den metrischen Variablen auffassen: welche jeweiligen Ausprä- 
gungen zusammen auftreten. Abb. 4.10 zeigt z.B.: je stärker die 
Verbreitung von Fernsehgeräten, desto geringer die Zahl der Ki- 
nobesucher. 

Die gemeinsame Häufigkeitsverteilung von drei und mehr ka- 
tegorialen Merkmalen wird durch weitere Unterteilung der Tabel- 
len erreicht. So kann man das obige Ergebnis des Zusammenhangs 
zwischen Einkommen und der Meinung zur sozialen Gerechtigkeit 
noch weiter differenzieren, indem man als drittes Merkmal die 
beiden Teile Deutschlands hinzunimmt. Wie man ein drittes 
Merkmal zusätzlich in einer Tabelle unterbringt, dafür gibt es nun 
schon mehrere Möglichkeiten. Man kann zum einen zwei getrenn- 
te Kreuztabellen schreiben, eine für die neuen und eine für die 
alten Bundesländer. Bei Merkmalen mit sehr wenigen Kategorien, 
wie eben bei diesem Beispiel, ist es aber auch möglich, innerhalb 
der Tabelle noch einmal zu unterteilen. Dann erhält man folgendes 
Ergebnis (zusätzlich V3 ALLBUS 98): 



Tabelle 4.3: Weiter unterteilte Kreuztabelle 

com. * SOZIALE UNTERSCHIEDE SIND GERECHT * ERHEBUNGSGEBIET: WEST - OST Kreuztab 



% von Einkorn. 



ERHEBUNG 
SGEBIET: 
WEST - OST 


SOZIALE UNTERSCHIEDE SIND GERECHT 


Gesamt 


STIMME 
VOLL ZU 


STIMME 
EHER ZU 


STIMME 
EHER 
NICHT ZU 


STIMME GAR 
NICHT ZU 


West 


Einkorn. 


unter 1 500 


5,3% 


25,0% 


35,0% 


34,7% 


100,0% 






1500-3000 


7,5% 


27,1% 


36,7% 


28,7% 


100,0% 






über 3000 


5,4% 


29,4% 


42,2% 


23,0% 


100,0% 


Ost 


Einkorn. 


unter 1 500 


1,6% 


7,4% 


32,6% 


58,5% 


100,0% 






1500-3000 


1,0% 


8,7% 


38,7% 


51,7% 


100,0% 






über 3000 


6,1% 


24,2% 


27,3% 


42,4% 


100,0% 



Wie interpretiert man diese Tabelle? Zusätzlich zu dem obigen 
Ergebnis ergibt sich hier die Möglichkeit, festzustellen, ob der 
Zusammenhang im Osten anders als im Westen Deutschlands ist. 
Die Unterschiede zwischen Ost und West sind in jeder der drei 
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Einkommensgruppen erheblich größer als die zwischen den Ein- 
kommensgruppen. D.h. der festgestellte Zusammenhang zwischen 
der Meinung zu sozialen Unterschieden und dem Einkommen ist 
unterschiedlich in West und Ost. Um die Unterschiede genauer 
festzustellen zu können, ist wieder auf die Zeilen prozentuiert 
worden, denn in absoluten Zahlen gibt es doppelt so viele Befragte 
im Westen wie im Osten. An dieser prozentuierten Tabelle sieht 
man, dass im Osten sich die unteren Einkommensgruppen stärker 
von den oberen unterscheiden als im Westen, und dass im Westen 
der festgestellte Zusammenhang deshalb schwächer ist. 

Stellt man sich nun vor, noch mehr Merkmale hinzuzunehmen, 
so gelangt man schon an die Grenzen der Darstellungsmöglichkei- 
ten in Tabellen und Grafiken, da mehr als 3 Dimensionen für uns 
nicht darstellbar sind. Deshalb dient ein beträchtlicher Teil der 
Verfahren der höheren Statistik (Faktorenanalyse, Clusteranalyse, 
mehrdimensionale Skalierung (MDS), ...) dazu, eine Vielzahl von 
Dimensionen auf für uns interpretierbare und darstellbare zwei zu 
reduzieren. 

Eine solche mehrdimensionale Häufigkeitsverteilung der Per- 
sonen in Bezug auf viele wichtige Merkmale könnte aber zeigen, 
dass bestimmte Merkmalskombinationen gehäuft auftreten. Letzt- 
lich gäbe dann eine vieldimensionale Grafik oder Kreuztabelle der 
gemeinsamen Verteilung von wesentlichen sozialen Merkmalen 
genau das wieder, was man unter Sozialstruktur versteht: nämlich 
die Tatsache, dass man soziale „Schichten“, „Lagen“, „Gruppen“, 
oder wie man sie auch immer nennen will, erkennen kann, die sich 
dadurch abgrenzen lassen, dass sie jeweils hinsichtlich einer unter- 
schiedlichen Menge der sozialen Merkmalen ähnlich sind. 



Weitere Literatur zu diesem Kapitel: Clauß u.a.: 23-36, 63-66 
Hochstädter: 35-56, 103-112, Kühnel/Krebs: 41-50, 56-63 
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Übungsaufgaben: 

1. Die folgende bereits geordnete Urliste enthält die Zahl der Stun- 
den, die 20 befragte Personen als die Zeit angegeben haben, die sie 
in einer Woche vor dem Fernseher sitzen: 

0,0,4,4,6,6,6,12,12, 16, 16, 16,20,20,20,20,30,30,40,40 

a) Erstellen Sie eine Tabelle der absoluten und relativen Häufig- 
keiten. 

b) Stellen Sie die absolute Verteilung, sinnvoll gruppiert, grafisch 
dar. 

2. 30 Schüler wurden in 3 gleich große, etwa gleich begabte und 
vorgebildete Gruppen eingeteilt, um an einem Experiment teilzu- 
nehmen, das die Wirkung von Videos auf das Lernen messen soll. 
Dazu nimmt jede Gruppe an einem Lerntest teil, mit dem der 
Lernerfolg gemessen wird (0= nicht bestanden; 1= bestanden): 
eine Gruppe ohne, die zweite nach einmaligen und die dritte nach 
2-Mal wiederholtem Sehen desselben Lern-Videos. Es ergibt sich 
folgende Urliste: 



Video nie 
gesehen 


0 


0 


1 


1 


0 


1 


0 


1 


0 


0 


1 Mal 
gesehen 


1 


0 


1 


1 


0 


1 


1 


0 


1 


1 


2 Mal 
gesehen 


1 


1 


0 


1 


0 


1 


1 


1 


1 


1 



Präsentieren Sie das Ergebnis in einer Kreuztabelle. 





Kapitel 5: Lageparameter 



In diesem Kapitel wird damit begonnen, die Häufigkeitsverteilung 
von Daten mit Hilfe von Kennzahlen, sog. Parametern, zu be- 
schreiben und zusammenzufassen. 



Definition : Parameter oder Kennwerte einer Häufigkeitsver- 
teilung sind Kenngrößen, mit deren Hilfe die Verteilung z.T. 
oder vollständig rekonstruiert werden kann. 



Die Parameter, die in diesem Kapitel beschrieben werden, beschäf- 
tigen sich mit der Lage der Verteilung eines Merkmals. Durch die 
möglichen Ausprägungen des Merkmals ist ja eine Skala vorgege- 
ben: Z.B. kann eine Fragebogen - Frage mit einer Zahl von 1 bis 7 
beantwortet werden, oder das erhobene Einkommen kann von 0 
bis zu ein paar Millionen gehen. Die Lageparameter geben Aus- 
kunft darüber, an welcher Stelle dieser möglichen Bandbreite der 
Skala sich etwa die „Mitte“ bzw. der „Schwerpunkt“ der Vertei- 
lung befindet. Je nach Skalenniveau und nach Fragestellung gibt es 
unterschiedliche Lageparameter. Die wichtigsten sind der Modus 
oder Modalwert, der Median oder Zentralwert und das arithmeti- 
sche Mittel bzw. Mittelwert. Die Daten, die im folgenden verwen- 
det werden, stammen wieder aus dem Datensatz des ALLBUS von 
1994 und stellen somit die Verteilungen wichtiger soziodemografi- 
scher Merkmale in der Bevölkerung Deutschlands dar, da alle 
Ergebnisse dieser Daten auch verallgemeinert werden können, wie 
in den späteren Kapiteln (9 und ff.) gezeigt werden wird. 



V. Müller-Benedict, Grundkurs Statistik in den Sozialwissenschaften, 

DOI 10. 1007/978-3-53 1-93225-5_5, ©VS Verlag für Sozialwissenschaften | 
Springer Fachmedien Wiesbaden GmbH 2011 
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5.1 Der Modus 



Definition : Der Modus oder Modalwert D einer kategorialen 
Häufigkeitsverteilung ist der Wert der häufigsten Merkmalsaus- 
prägung. Sind mehrere Ausprägungen gleich häufig, so gibt es 
mehrere Modalwerte. 



Damit ist der Modal wert nur definiert für kategoriale Variablen. 
Will man den Modus einer intervallskalierten Variablen berech- 
nen, muss man sie vorher in Messklassen einteilen, so dass sie 
kategorial wird. Als Beispiel folgt die Verteilung der Religionszu- 
gehörigkeit in Großstädten und ländlichen Gebieten (V321 in 
ALLBUS 94): 



Tabelle 5.1: Religionszugehörigkeit in ländlichen Gebieten und 
Großstädten 



Ländliche Gebiete (< 20000 Ew.) 


f(X) 


%(X) 


römisch-katholisch 


418 


35,5 


evangelisch ohne Freikirche 


439 


37,2 


evangelische Freikirchen 


22 


1,9 


andere christliche Religionen 


11 


0,9 


andere nicht-christl. Religionen 


3 


0,3 


keine Religionsgemeinschaft 


286 


24,3 


Total 


1179 


100,0 



Großstädte (> 500000 Ew.) 


f(X) 


%(X) 


römisch-katholisch 


313 


26,1 


evangelisch ohne Freikirche 


391 


32,6 


evangelische Freikirchen 


27 


2,3 


andere christliche Religionen 


26 


2,2 


andere nicht-christl. Religionen 


33 


2,8 


keine Religionsgemeinschaft 


409 


34,1 


Total 


1199 


100,0 
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Damit ergibt sich im ersten Fall mit den Häufigkeiten 418, 439, 
22, 11, 3, 286 als häufigster Wert der Modalwert „Evangelisch 
ohne Freikirche“ (439 Fälle); im zweiten Fall mit 313, 391, 27, 26, 
33, 409 ist der Modalwert „keine Religionsgemeinschaft“ (409 
Fälle). In ländlichen Gebieten ist die evangelische Landeskirche 
die häufigste Art der Religionsausübung, während in den Groß- 
städten die häufigste Art mittlerweile darin besteht, keiner Kir- 
chengemeinschaft mehr anzugehören. Der Modus ist, wie man an 
diesem Beispiel sieht, dann besonders zur Beschreibung geeignet, 
wenn es sich um Daten mit Nominalskalenniveau handelt, die 
nicht geordnet werden können. 

Wenn der Modalwert von Messwertklassen gebildet wird, d.h. 
von einer eigentlich intervallskalierten Variable, ist er von der 
Messklasseneinteilung abhängig. Sei die gruppierte Altersvertei- 
lung gegeben durch die zwei folgenden Einteilungen in 10- oder 
15- Jahresgruppen (V247 in ALLBUS 94). 

Tabelle 5.2: Altersverteilung in zwei verschiedenen Messklassen 



1 0-J ahres- Altersklassen 


f(X) 


%(X) 


18-27 


576 


16,7 


28-37 


702 


20,3 


38-47 


634 


18,4 


48-57 


603 


17,5 


58-67 


515 


14,9 


68-77 


287 


8,3 


über 77 


129 


3,7 


Total 


3446 


100,0 



15-Jahres- Altersklassen 


f(X) 


%(X) 


18-32 


936 


27,2 


33-47 


976 


28,3 


48-62 


883 


25,6 


63-77 


522 


15,1 


über 77 


129 


3,7 


Total 


3446 


100,0 
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Damit wäre der Modus für die 10-Jahresklasseneinteilung die 
Klasse von 28 - 37 Jahren, aber für die 15-Jahresklasseneinteilung 
die Klasse von 33 - 47 Jahren. Man käme deshalb für die erste 
Klasse zu dem Schluss, dass die größte Altersgruppe der Befragten 
die zwischen 28 und 37 Jahren ist, und für die zweite zu dem 
Schluss, dass es die Gruppe zwischen 33 und 47 Jahren ist, zwei 
Intervalle, die sich nur wenig überschneiden. Das Beispiel zeigt, 
dass der Modus bei gruppierten intervallskalierten Daten nur mit 
Vorsicht angewendet werden sollte. 



5.2 Der Median 

Der Median gibt an, welche Merkmalsausprägung der mittlere Fall 
hat, d.h., er gibt die Ausprägung an, bis zu der 50% aller Fälle 
liegen. Seien z.B. 7 Fälle mit den Werten 1, 3, 3, 5, 6, 12, 28 ge- 
geben. Dann ist 5 der Wert des Falls in der Mitte. 



Definition : Der Median oder Zentralwert ( X , Z) eines Merk- 
mals ist die Ausprägung des Falls in der Mitte der der Größe 
nach (man sagt auch: nach Rangplätzen) geordneten Fälle. Bei 
einer geraden Anzahl wird die Ausprägung der beiden in der 
Mitte liegenden Fälle gemittelt. 

Offenbar ist der Median nur für Daten definiert, die mindestens 
Ordinalskalenniveau haben. Ein einschlägiges Beispiel ist deshalb 
die Schulbildung. Folgende Daten liegen für Personen über 50 
Jahre vor (V12 in ALLBUS 94): 



Tabelle 5.3: Allgemeiner Schulabschluss mit Alter >=50 





Code 


f(X) 


%(X) 


kein Abschluss 


1 


47 


3,3 


Hauptschulabschluss 


2 


987 


68,4 


mittlere Reife, Realschulab. 


3 


234 


16,2 


Fachhochschulreife 


4 


41 


2,8 


Abitur, Hochschulreife 


5 


134 


9,3 


Total 




1443 


100,0 
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Die Ordnungsrelation bei der Schulbildung ist klar: die „höheren“ 
Abschlüsse schließen die jeweils darunter liegenden ein. Wenn 
man alle 1443 Fälle der Größe nach ordnet, bekommt man folgen- 
de Reihe der vercodeten Werte: 

1, 1, ...(47-mal)..., 1, 2, 2, ...( 987-mal)..., 2, 3, 3, ... (234-mal)..., 3, 
4, 4, ...(41-mal)...,4, 5, 5, ...(134-mal) ... ,5. 

Die Mitte von 1443 ist genau der 722. Fall. Dieser Fall hat offen- 
bar die Ausprägung 2. Der Median dieser Daten ist deshalb 2: X = 

2. Die ersten 50%, d.h. die erste Hälfte aller Fälle hat eine Ausprä- 
gung <= 2, d.h. Hauptschulabschluss. In Worten ausgedrückt: 
Mindestens die Hälfte der über 50-Jährigen Befragten verfügt nur 
über einen Hauptschulabschluss. 

Zum Vergleich die gleiche Tabelle für die unter 50-Jährigen: 



Tabelle 5.4 Allgemeiner Schulabschluss mit Alter < 50 





Code 


f(X) 


%(X) 


kein Abschluss 


1 


27 


1,4 


Hauptschulabschluss 


2 


660 


33,9 


mittlere Reife, Realschulab. 


3 


783 


40,2 


Fachhochschulreife 


4 


122 


6,3 


Abitur, Hochschulreife 


5 


356 


18,3 


Total 




1948 


100,0 



Einen mittleren Fall bei diesen 1948 Fällen gibt es nicht, weil das 
eine gerade Anzahl von Fällen ist. Die beiden mittleren Fälle ha- 
ben die Nummern 974 und 975. Wenn man wieder alle Fälle der 
Größe nach ordnet, so wie sie ja auch schon der Tabelle stehen, so 
sieht man, dass alle Fälle von Fall 688 bis zum Fall 147 1 die Aus- 
prägung 3 haben, d.h. auch die beiden mittleren Fälle. Das Mittel 
dieser beiden Fälle ist dann ebenfalls: 

(3 + 3) / 2 = 3 

Deshalb ist der Median dieser Daten 3: X = 3 (Realschule). Die 
(obere) Hälfte der unter 50-Jährigen Befragten besitzt mindestens 
einen Realschulabschluss. Man sieht an dieser Veränderung des 
Medians, dass die Steigerung der Bildungsabschlüsse eine wesent- 
liche Veränderung der letzten 20 Jahre ausmacht. 
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Die Eigenschaft, dass der Median die geordneten Daten in der 
Mitte teilt, kann man benutzen, um ihn auch auf grafische Weise 
zu ermitteln. Man zeichnet die kumulierte Häufigkeitsverteilung 
auf, und in diese kumulierte Verteilung bei 0,5 = 50% eine waage- 
rechte Linie. 




KEIN ABSCHLUSS MITTL.REIFE,REALSCH. ABITUR, HOCHSCHULREI. 

VOLKS-, HAUPTSCHULAB FACHHOCHSCHULREIFE 

ALLGEMEINER SCHULABSCHLUSS 



Abbildung 5.1: kumulierte Verteilung der Schulabschlüsse der unter 50-Jährigen 



Die Linie schneidet die kumulierte Kurve in dem Abschnitt, in 
dem diese den Wert 3 = Realschulabschluss hat (auf der X-Achse 
steht eine kategoriale Einteilung, nur diskrete Werte!). Offenbar 
braucht man eine Mittelung von zwei mittleren Werten bei geraden 
Fallzahlen nur vorzunehmen, wenn diese Linie die kumulierte 
Kurve gerade an einem Knick schneidet. 

Es gibt eine Reihe von Begriffen, die über den Median defi- 
niert sind, z.B.: 

die Halbwertszeit eines Stoffes, etwa des radioaktiven Atom- 
mülls, ist der Median der Lebensdauerverteilung dieses Stof- 
fes 

die letale Dosis eines Gifts ist die Dosis, bei der 50% aller 
Versuchstiere sterben 
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die Wahrnehmungsschwelle eines Reizes ist die Reizstärke, 
bei der 50% aller Versuchspersonen diesen Reiz wahrnehmen. 

Eigenschaften des Medians : 

1 . Der Median ist nur für mindestens ordinalskalierte Daten ge- 
eignet. 

2. Der Median ist unempfindlich gegenüber sog. Ausreißern, 
d.h. erhobenen Daten, die nicht in die Häufigkeitsverteilung 
aller anderen Fälle passen. Angenommen, in den obigen Tabel- 
len wäre aus Versehen ein Daten wert falsch eingetippt, so dass 
aus einer 3 für Realschule eine 333 geworden ist. Das hätte die 
Median-Berechnung nicht verändert, es wäre derselbe Median 
errechnet worden. Man sagt in diesem Fall, der Median sei ro- 
bust gegenüber Ausreißern . 

3. Der Median ist das Minimum der Funktion der Summe der 
„Abstände“ aller Werte zu einem beliebigen Wert a, wobei der 
Abstand gemessen wird als Betrag der Differenz: 

n n 

y' j I Xj - al > ^ I Xj - X I für alle a, 
i=1 i=1 

d.h. er ist der Wert, der den kleinsten „Abstand“ zu allen ande- 
ren Werten gleichzeitig hat (Beweis Schlittgen 1986: 117). 

Exkurs: 

Der Absolutbetrag I ... I eines mathematischen Ausdruck ist sein 
Wert ohne Vorzeichen, d.h. immer positiv. Der Absolutbetrag 
der Differenz zweier Zahlen stellt ihren Abstand dar. Beispiel: 
15-71 = 17-51 = 2, 

Exkurs'. Berechnung des Medians bei gruppierten Daten 
Wenn nur gruppierte intervallskalierte Daten vorliegen, muss 
man den Median aus der Messwertklasse schätzen, in der der 
mittlere Wert liegt. Er ist dann die Summe aus der Klassenun- 
tergrenze und dem Teil des Intervalls der Messwertklasse, der 
dem mittleren Wert entspricht. 
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Die Berechnung des Medians bei gruppierten Daten verläuft 
wie folgt: 

Exakte Untergrenze der Messwertklasse, in der der mittlere Fall 
liegt, plus der, dem mittleren Fall entsprechende Teil der Breite 
dieser Klasse. 

Beispiel: Einkommensverteilung in 3 Klassen (Tabelle S. 42 
unten). Der mittlere Wert ist der 10,5te (gerade Anzahl Fälle!). 
Die zugehörige Messwertklasse ist die von 1500-3000 Jahre 
und hat eine Breite von 32 Jahren. In diesem Intervall liegen 9 
Fälle, der 10,5. Fall insgesamt ist davon der 2,5te in diesem In- 
tervall, weil 8 Fälle schon im ersten Intervall liegen. D.h., die 
Länge des Teils des Intervalls bis zu dem „Median“-Fall ist 
2,5/9. Der Median aus den gruppierten Daten ergibt sich des- 
halb zu 

1500 + (3000-1500) • 2,5/9 = 1500 + 416,67 = 1916,67. 



5.3 Der Mittelwert 

Der bekannteste und wichtigste Lageparameter ist der Mittelwert. 
Er bildet das ab, was man gemeinhin als „Durchschnitt“ oder 
„Gleichgewicht“ aus einer Menge von Daten empfindet. Ein Bei- 
spiel: die Sehbeteiligung bei einer wöchentlich ausgestrahlten 
Sendung sei in 4 Wochen: 1 Mio, 1 Mio, 1 Mio, 3 Mio, dann ist 
der wöchentlicher Durchschnitt: 1,5 Mio. 



Definition : Der Mittelwert oder das arithmetische Mittel eines 
Merkmals X wird wie folgt gebildet. Sei N = Anzahl der Fälle 
und x, die Ausprägung des i-ten Falls. Dann ist 

X = - > X 
N 7 ' 



I 

i=i 



Als Beispiel soll mit einer Mittelwert-Berechnung die Frage ge- 
klärt werden, ob Frauen oder Männer dem Zusammenleben ohne 
Trauschein mehr zustimmen. Es sei also die Frage gestellt: „Stim- 
men Sie der Behauptung zu: es ist in Ordnung, dass ein Paar zu- 
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sammenlebt, ohne zu heiraten?“ Die Antwort-Skala sei eine 7-er 
Skala. Sie gilt mit ihrer äquidistanten 7-Schritt-Einteilung als in- 
tervallskaliert, so dass man mit den Antwort-Zahlen alle mathema- 
tischen Operationen ausführen kann. Gegeben sei die folgende 
fiktive Häufigkeitstabelle von Antworten: 



Tabelle 5.5: Häufigkeitsverteilung (7er-Skala) 



Zusammenleben ohne Trau- 
schein? 


Code 


Männer 


Frauen 


Lehne völlig ab 


1 


0 


0 


Lehne ab 


2 


1 


0 


Lehne ein wenig ab 


3 


1 


1 


Weder noch 


4 


3 


3 


Stimme ein wenig zu 


5 


5 


6 


Stimme zu 


6 


6 


6 


Stimme völlig zu 


7 


4 


5 


Summe 




20 


21 


Mittelwert 




5,3 


5,52 



Mittelwert Männer: 

(2+3+4+4+4+5+5+5+5+5+6+6+6+6+6+6+7+7+7+7)/20 = 5,3 
Mittelwert Frauen: 

(3+4+4+4+5+5+5+5+5+5+6+6+6+6+6+6+7+7+7+7+7)/21 = 5,52 
Offenbar stimmen die Frauen dem nicht verheirateten Zusammen- 
leben mehr zu als die Männer. Wie man sieht, kommt hier als 
Ergebnis eine Zahl heraus, die in den Ausprägungen des Merkmals 
in den Rohdaten gar nicht vorhanden war, nämlich eine Zahl zwi- 
schen 5 und 6. Das ist möglich wegen der Annahme des Intervall- 
skalenniveaus der Antwort-Skala. Diese Annahme bedeutet, dass 
das Merkmal „Zustimmung zum Zusammenleben“ sich im Prinzip 
beliebig genau messen lässt. 

Die Summen lassen sich aber auch anders berechnen, indem 
man direkt die Spalten aus der Tabelle verwendet: 

Mittelwert Männer: (1-0 + 2-1 + 3-1 + 4-3 + 5-5 + 6-6 + 7-4)/20 
Damit erhält man die Formel zur Berechnung des Mittelwerts aus 
der Häufigkeitstabelle (X, = Ausprägung der i-ten Gruppe): 
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"| k k 

x = -^X i f(X i )= ^XpfXi) 

i=1 i=1 

Man beachte: hier wird über die Ausprägungen groß X, des Merk- 
mals X summiert, nur bis k (Anzahl der Ausprägungen); klein x 
sind dagegen die n Fälle. 

Hat man nur gruppierte Daten vorliegen, kennt also nur die 
Häufigkeitsverteilung von zu Messwertklassen zusammengefass- 
ten Daten, so muss man den Mittelwert über eine solche Summie- 
rung der letzten Art schätzen, indem man die Klassenmitten als 
Schätzwerte für die jeweiligen X,, die Ausprägungen, nimmt. Als 
Beispiel wird das Durchschnittsalter aus der obigen 15- 
Jahresklassen-Einteilung der Altersverteilung (Tabelle 5.2 unten, 
Mitte der Klasse „18 bis 32“ ist (18+32)/2 = 25, usf.) berechnet: 

X = (936- 25 + 976- 40 + 883- 55 + 522 • 70 + 129 • 85) / 3446 
= (23400 + 39040 + 48565 + 36540 + 10965)/ 3446 
= 158510/3446 = 45,9 

Das ist eine ganz gute Schätzung, denn der „wahre“, d.h. mit den 
nicht gruppierten Rohdaten berechnete Mittelwert liegt bei 45,83. 
In SPSS sieht die Ausgabe der drei Lageparameter wie folgt aus: 

Tabelle 5.6: SPSS-Ausgabe von Lageparametem 



Statistiken 

ALTER: BEFRAGTE<R> 



N Gültig 


3446 


Fehlend 


4 


Mittelwert 


45,83 


Median 


44,00 


Modus 


27 



Hier wird zwar auch der Modus berechnet, er hat aber bei dieser 
intervallskalierten Variable nur eine geringe Aussagekraft, da 
immer nur wenig Fälle auf einen Jahrgang entfallen. 

Bei der letzten Berechnungsart des Mittelwerts wurde die 
Gesamtmenge der Fälle zerlegt in mehrere Teilgruppen, die sich 
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durch die Ausprägungen des untersuchten Merkmals unterschei- 
den. Die Formel gilt nun genauso, wenn man die Fälle nach belie- 
bigen anderen Kriterien unterteilt, etwa nach den Ausprägungen, 
die die Fälle in Bezug auf ein anderes Merkmal haben, z.B. Ge- 
schlecht. 



Definition: Eine Zerlegung ist eine Aufteilung des Datensatzes 
in k Teilgruppen von Fällen, so dass jeder Fall in genau eine 
Teilgruppe kommt. 



Wichtig dabei ist, dass durch die Zerlegung in Teilgruppen jeder 
Fall in genau eine dieser Gruppen fällt; das ist definitionsgemäß 
der Fall bei gruppierten Daten. Als Beispiel folgt die Berechnung 
des Gesamtmittelwerts für „Zusammenleben ohne Trauschein“ aus 
der Zerlegung aller Fälle in die Teilgruppen der Männer und Frau- 
en: 

Zerlegung der 41 Fälle in 20 Männer und 21 Frauen 
Anteil der Männer: 20/41, Mittelwert Männer: 5,3 
Anteil der Frauen: 21/41, Mittelwert Frauen: 5,52 

Gesamtmittelwert = 5,3- (20/41) + 5,52- (21/41) = 5,3-0,488 + 
5,52-0,512 = 2,59 + 2,83 = 5,42 

Man nennt eine Summe der obigen Art auch eine gewichtete 
Summierung, weil jeder Summand der Zerlegung mit einem Fak- 
tor bzw. Gewicht (hier die relative Häufigkeit) versehen wird, 
bevor sie aufsummiert werden. 



Definition: Eine Gewichtung ist die Zuordnung von Zahlen 
(„Gewichten“) zu jeder Teilgruppe einer Zerlegung. 



Mit diesen Begriffen kann man die Möglichkeit der Mittelwert- 
Berechnung aus Zerlegungen als Satz formulieren, der den Namen 
„Additionssatz des Mittelwerts“ trägt: Der Mittelwert eines Merk- 
mals ist die Summe der mit ihrer relativen Häufigkeit gewichteten 
Mittelwerte der Teilgruppen einer Zerlegung. 
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Manchmal reicht eine einzelne Variable nicht aus, um eine 
komplexe Meinung zu erfassen. Ein Beispiel: die einzelne Frage 
nach der Ehe ohne Trauschein ist wohl nicht ausreichend, um die 
Einstellung zur Heirat insgesamt festzustellen. Einige Forscher 
haben deshalb eine ganze Batterie von Fragen gestellt, z.B. die 
Zustimmung zu folgenden Behauptungen: 

„Verheiratete Menschen sind im Allgemeinen glücklicher als 
Menschen, die nicht verheiratet sind.“ 

„Es ist besser eine schlechte Ehe zu führen, als überhaupt nicht 
verheiratet zu sein.“ 

„Menschen, die Kinder wollen, sollen heiraten.“ 

„Es ist sinnvoll, dass ein Paar, das heiraten möchte, vorher zu- 
sammenlebt.“ 

etc. (Fragen aus ALLBUS 94) 

Diese Fragen decken verschiedene Bereiche ab, die für eine Heirat 
eine Rolle spielen können. Um daraus eine Gesamteinstellung zur 
Heirat zu konstruieren, werden oft die Antworten auf mehrere 
Fragen für jede Person addiert. Ein solches Vorgehen heißt Index- 
bildung. Bekannt ist z.B. der Index der Lebenshaltungskosten, der 
aus den Preisen für eine ganze Reihe von Lebensmitteln gebildet 
wird. 



Definition : Ein Index ist eine - möglicherweise gewichtete - 
Summe von Merkmalen. 



Der Index, der für jede befragte Person die Einstellung zur Heirat 
beschreibt, ist dann die Summe ihrer Antworten (Ausprägungen) 
auf die obigen Fragen zur Heirat. Da dieser Index für jede Person 
eine Zerlegung ihrer Einstellung auf die einzelnen Fragen bildet, 
lässt sich der Mittelwert eines Index ebenfalls leicht berechnen: 
der Mittelwert eines Index von Merkmalen ist der Index der Mit- 
telwerte der Merkmale. 

Wenn Mittelwert und Indizes sich so für Zerlegungen leicht 
berechnen lassen, ist das bei anderen Kombinationen nicht mög- 
lich. Insbesondere lässt sich der Mittelwert einer Teilgruppe, die 
aus einer Kombination von Merkmalen gebildet wird, nicht aus 
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den Mittelwerten der einzelnen Merkmale berechnen. Als Beispiel 
diene die Einstellung der Frauen über 50 Jahre zum „Zusammen- 
leben ohne Trauschein“. Er beträgt 4,5. Nimmt man nun den Mit- 
telwert der über 50-Jährigen insgesamt: 4,7 und dazu den Mittel- 
wert der Frauen insgesamt: 5,52, so kann man daraus nicht den 
Mittelwert der Frauen über 50 Jahre berechnen! Der Grund ist, 
dass die 2 Ausprägungen der „Frauen“ und „über 50-Jährig“ keine 
Zerlegung aller Fälle bilden, sondern sich überschneiden: 




Eigenschaften des Mittelwerts 

1 . Der Mittelwert ist nicht robust gegenüber Ausreißern. 

Wenn ein Datum auffällig von der Verteilung der anderen Da- 
ten ab weicht, kann das zu einer großen Veränderung beim Mit- 
telwert führen. Steht z.B. in den Daten zum „Zusammenleben“ 
statt der Beurteilung 7 bei einem Fall eine 77, so ergibt sich als 
neuer Mittelwert 6,9 gegenüber 5,42 vorhin. Der Median dage- 
gen bleibt bei einem solchen Fehler unverändert. 

2. Es gilt: 
n 

y x, = n- X . Die Gesamtsumme aller Werte hängt so mit 

i=i 

dem Mittelwert zusammen, 
n 

7, (x, - X ) = 0. Eine Möglichkeit der Normierung von 

i=1 

Daten (s.u.). 
n 

y (x; - a) 2 ist minimal für a = X . Die „Abstandsqua- 

i=i 

drate“ von X sind minimal. 
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Exkurs: Dichotomisierung und Mittelwert 
Es kann eine Beziehung zwischen Mittelwerten und der relati- 
ven Häufigkeit einer einzelnen Ausprägung, ihrem Anteil, her- 
gestellt werden. Sei ein Merkmal X dichotom, d.h. es habe nur 
zwei Ausprägungen. Dann fallen die Bedeutungen von Merk- 
mal und Ausprägung zusammen, denn die eine Ausprägung be- 
deutet dann: die Person besitzt Merkmal X und die zweite Aus- 
prägung bedeutet: besitzt es nicht. Ein Beispiel ist das Ge- 
schlecht. Man(n) ist eine Frau oder nicht (=Mann). Weist man 
dann dem Nicht-Besitz den Wert 0 zu (X=0 := Mann) und dem 
Vorhandensein des Merkmals den Wert 1 (X=l := Frau), so ist 
der Mittelwert dieses Merkmals, Frau zu sein, gleich seinem 
Anteil: 

X dichotom, 0/1 -codiert 
n 

X = (1/n) Yj Xi = 0+ l + l+ 0 + + 0+1+0+1 + 1+0 

i=1 

= f(Xi)/n = p(X i ) 

Da in der Summe von n Fällen nur gerade alle die Fälle mit dem 
Wert 1 zählen, bei denen das Merkmal vorhanden ist, ergibt die 
Summe gerade die Häufigkeit des Merkmals „Frau“. Hat man 
ein Merkmal mit mehreren Ausprägungen, so kann man eine 
interessierende Ausprägung mit 1 vercoden und allen anderen 
den Wert 0 (= „anders“) zuweisen. Diese Art Umcodierung 
heißt Dichotomisierung. Die relative Häufigkeit der interessie- 
renden Ausprägung ist dann der Mittelwert der bzgl. dieser 
Ausprägung dichotomisierten Variable. 



Vergleich der drei Mittelwerte: 

• Von Modus über Median zu Mittelwert werden immer 
mehr Informationen aus den Daten verwendet. 

• Die Werte von Modus über Median zu Mittelwert sind 
immer empfindlicher gegenüber Ausreißern. 

• Von Modus über Median zu Mittelwert wird immer höhe- 
res Skalenniveau benötigt, um aussagekräftig zu sein. 
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5.4 Verteilungsformen 

Im Weiteren wird die Frage behandelt, wie gut die verschiedenen 
Lageparameter eine Häufigkeitsverteilung beschreiben können. 






Anzahl gelesener Exemplare 
einer Monatszeitschrift 







Angestelltenzahl in 20 Krankheitstage von 20 

Lebensmittelgeschäften Angestellten 

Abbildung 5.2: Verschiedene Daten mit Mittelwert 5,4 (Quelle: Ehrenberg 1986) 



Als Beispiel vergleiche man die Mittelwerte der Merkmale in 
Abbildung 5.2. In allen diesen Fällen ist der Mittelwert immer 
gleich, nämlich 5,4! An diesen Beispielen sieht man, dass der 
Mittelwert als Angabe eines Durchschnitts der Daten ziemlich 
irreführend sein kann, wenn man die Verteilungsform das Merk- 
mals insgesamt nicht berücksichtigt. Man kann jedoch auch die 
anderen Lageparameter noch heranziehen, um vielleicht mit allen 
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dreien zusammen eine Charakterisierung verschiedener Vertei- 
lungsformen zu erreichen. 

Zunächst jedoch sollen die Verteilungsformen nach bestimm- 
ten Begriffen klassifiziert werden. Dabei benutzt man jeweils „ide- 
alisierte“ Häufigkeitsverteilungen, d.h. stetige, differenzierbare 
Kurven, die im Grunde nur für intervallskalierte Daten tatsächlich 
auftreten können, in die hinein man sich aber unschwer ein 
Histogramm auch von kategorialen Daten vorstellen kann, das 
dann eine vergleichbare Form aufweist. 




Abbildung 5.3: Verteilungsformen (Clauß u.a.: 33) 



Man unterscheidet zunächst eingipflige (unimodale) (in der Abb. 
5.3 a), c), d), e), g), h)) von zwei- ( bimodale ) (b), f)) und mehr- 
gipfligen (multimodale) Verteilungen. Bimodale Verteilungen 
eines Merkmals werfen mehr Fragen der Interpretation auf als 
unimodale. Der Modus als beschreibender Parameter hat offenbar 
nur bei unimodalen Verteilungen einen Sinn. Bei unimodalen 
Verteilungen kann man i.A. von einer zentralen Tendenz ausge- 
hen, mit der die Mehrheit der Fälle ausgestattet ist, und von der es 
mehr oder weniger große Abweichungen gibt. Bei einer bimodalen 
Verteilung gibt es zwei Möglichkeiten: 1. Sie kann durch das Feh- 
len einer solchen zentralen Tendenz hervorgerufen sein, das be- 
deutet dann, das dieses Merkmal in der Bevölkerung kontrovers 
bzw. polarisiert vorhanden ist. Oder 2.: die Bimodalität wird durch 
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die Koppelung mit einem weiteren, bisher unbekannten Merkmal 
hervorgerufen. Das zeigt Abbildung 5.4: Die Bimodalität des An- 
teils von Lehrerinnen in Gymnasien in den 50er und 60er Jahren 
wurde durch die damals noch vorhandene Trennung in Jungen- 
und Mädchengymnasien hervorgerufen, die im Laufe der 70er und 
80er Jahre aufgehoben wird. 




Abbildung 5.4: Lehrerinnen- Anteil an Gymnasien in Rheinland-Pfalz (bis zur 

Aufhebung der getrennt-geschlechtlichen Schulen (ca. 1970) bimodal) (Quel- 
le: Kraul/TroitzschAVirrer 1995) 



Eine zweite Differenzierung ist die in symmetrische (in der Abb. 
5.3 a), b), f), g), h)) und unsymmetrische (c), d), e)) Formen. Die 
unimodale symmetrische Form ist die typische Form von Daten, 
die zufällig um einen Mittelwert streuen, den sie im Idealfall alle 
erreichen sollten, also etwa Daten einer maschinellen Herstellung 
eines Produkts, etwa der Abfüllgewichte, die eine Verpackungs- 
maschine erzeugt. Sie soll eigentlich immer exakt 4 kg abwiegen, 
aber wiegt eben doch mal etwas mehr und mal etwas weniger, aber 
gleichmäßig gestreut um den Mittelwert von 4 kg, und größere 
Abweichungen sind seltener. Bei dieser Verteilungsform und Da- 
tenherkunft hat der Mittelwert seine stärkste Aussagekraft, weil 
man mit ihm sozusagen auf den Zweck der Daten zurück schließen 
kann. Nur mit einer solchen Form macht auch die Interpretation 
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der Abweichung vom Mittelwert, also der Differenz von tatsächli- 
chem Datum und Mittelwert, als „Fehler“ einen Sinn (s. Abb. 5.5). 



Definition : Die Differenz (x, - X ) eines Datums vom Mittelwert 
wird als „Fehler“ oder „Residuum“ des Datums bezeichnet. 




CASES 

Abbildung 5.5: Residuen (Mittelwert = O-Linie) 



Unimodale nicht-symmetrische Formen sind in der einen oder 
anderen Richtung schief und werden deshalb als links- (in der Abb. 
5.3 c), e)) bzw. rechtssteil (d)) bezeichnet. Linkssteile Verteilungs- 
formen kommen oft dann vor, wenn die Daten in einer Richtung 
eine natürliche Grenze haben und in der anderen Richtung eher 
unbegrenzt sind. Beispiele für solche Daten sind das Einkommen 
oder die Kinderzahl. Beide können auf der einen Seite nicht unter 
0 sinken, sind aber auf der anderen Seite relativ unbegrenzt (s. 
Abbildung 5.6, V701 aus ALLBUS 80-96) 
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ANZAHL DER KINDER, BEFR. 

Abbildung 5.6: Kinderzahl 

Rechtssteile Verteilungsformen findet man oft dann, wenn Fragen 
gestellt werden, auf die es eine Antwort gibt, die sowohl von ge- 
ringer praktischer Betroffenheit als auch von großer sozialer Er- 
wünschtheit ist, etwa allgemeine Fragen zu Tier- und Umwelt- 
schutz, zum Lebensgenuss etc. Die Befragten können dann, weil 
sie selbst kaum betroffen sind, leicht ganz positive Einstellungen 
äußern, so dass die häufigsten Antworten im positiven rechten 
Bereich sind (s. Abbildung 5.7, Varl91 aus der Shell- 
Jugendstudie 97): 




1000' 



800' 




wichtig: das Leben gen. 



Abbildung 5.7: Wichtigkeit des Ziels, „das Leben zu genießen“, für Jugendliche 
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Eine weitere Unterteilung ist diejenige in flache (in der Abb. 5.3 
h)) und schmale (g)) Formen. Je schmaler die Form ist, desto mehr 
Erklärungskraft haben alle Lageparameter. Wenn die Verteilung 
breit ist, sagt eine Angabe über die Mitte wenig aus. Eine flache 
Verteilung bedeutet ja, dass alle Ausprägungen dieses Merkmals 
ähnlich oft Vorkommen. Bei einem sozialen Merkmal bedeutet das, 
dass die Gesellschaft bezüglich dieses Merkmals heterogen ist; in 
Bezug auf dieses Merkmal gibt es keinen sinnvollen Durchschnitt, 
also keinen Ansatzpunkt, eine bestimmte Ausprägung für „nor- 
mal“ zu halten. 

Extremformen dieser verschiedenen Differenzierungen haben 
eigene Namen. Ein Extrem der flachen Verteilung ist die Gleich- 
verteilung, bei der jede Ausprägung gleich häufig ist. Solche Ver- 
teilungen entstehen, wenn die Ausprägungen per Zufall ausge- 
wählt werden. Beim Würfeln z.B. fallen alle 6 Zahlen gleich oft. 

Ein Extrem einer bimodalen Verteilung ist die U-förmige 
Verteilung, bei der die Maxima direkt am Rand der möglichen 
Werteskala liegen. U-förmige Verteilungen von Meinungen oder 
Einstellungen deuten darauf hin, dass hier eine starke Polarisierung 
der Befragten vorliegt: ein großer Teil befindet sich auf dem einen 
Ende, der andere auf dem entgegen gesetzten Ende der Mei- 
nungsmöglichkeiten. 




Abbildung 5.8: U-förmige Verteilung des Umweltschutzverhaltens (Quelle: Lüde- 
mann 1995:70) 
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Das Ergebnis einer Studie von Lüdemann in Abbildung 5.8 zeigt, 
dass z.B. in Umweltschutzfragen die Möglichkeit einer solchen 
Polarisierung besteht: Ein großer Teil der Befragten beteiligt sich 
„immer“ (bei 0% anderen auch) an der Container-Entsorgung, und 
ein ebenfalls recht großer Teil beteiligt sich „nie“ (nur bei 100% 
anderen auch) daran, dazwischen befinden sich viel weniger Per- 
sonen. 

Das Extrem einer schiefen Verteilung ist die J- bzw. L - för- 
mige Verteilung. Eine L-förmige Verteilung findet man u.a. oft 
dann, wenn die Daten in irgendeiner Weise zeitliche Abweichun- 
gen von einer Norm darstellen, z.B. Krankheitstage, Zu-Spät- 
Kommen in Minuten (s.o. in der Abbildung 5.2 „Krankheitstage“) 



Tabelle 5. 7: Beschreibende Merkmale von Häufigkeitsverteilungen 



Beschrei- 

bendes 

Merkmal 


einfache 

Ausprä- 

gung 


kompli- 

zierte 

Auspr. 


Extreme 

Ausprä- 

gung 


mit extremer 
Ausprägung 
Hinweise auf 


Anzahl 

Gipfel 


unimodal 


bimodal 

oder 

mehr- 

gipflig 


U-förmig 


Polarisierung 

(Meinung), 

verborgenes 

dichotomes 

Merkmal 


Symme- 

trie 


Symme- 

trisch 


links - 
oder 

rechtssteil 


L-förmig 

oder 

J-förmig 


Überschreitung 
von „Sollwer- 
ten“ 


Steilheit 


schmal 


flach 


Gleich- 

verteilung 


Heterogenität 



Warum eine so ausgefeilte Beschreibung der Verteilungsformen? 
Der tiefere Grund ist, dass sozialwissenschaftliche Daten wieder- 
um meist anders verteilt sind als naturwissenschaftliche Daten. 
Naturwissenschaftliche Daten stammen vielfach aus Experimen- 
ten, d.h. es gibt einen Sollwert und eine fehlerhafte Abweichung, 
die aus dem Aufbau der Experimente stammt. Sie sind deshalb oft 
eingipflig und symmetrisch, also von der einfachsten Form. Sozi- 
alwissenschaftliche Daten dagegen stammen meist nicht aus Expe- 
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rimenten, sondern aus einmaligen Erhebungen. Sie versuchen 
zudem mit ihren Merkmalen die gesellschaftlichen Strukturen zu 
erfassen, und die sind durch ein hohes Maß an Ungleichheit und 
Heterogenität gekennzeichnet. Sozialwissenschaftliche Daten 
weichen deshalb in besonderem Maße vom Ideal der eingipfligen 
und symmetrischen Verteilung ab, und deshalb sind differenzierte- 
re Beschreibungsmöglichkeiten notwendig. 

In welcher Weise geben nun die Lageparameter Aufschluss 
über die Form der Verteilung? Zunächst werde die unimodale 
symmetrische Verteilung betrachtet. Bei dieser Verteilungsform 
fallen idealer Weise alle drei Lageparameter zusammen. Weil sie 
symmetrisch ist, teilt der Median die Daten genau am Mittelwert, 
der gleichzeitig der häufigste Wert, also der Modus, ist. Bei rechts- 
schiefen bzw. linksschiefen uninrodalen Verteilungen jedoch gilt 
folgende Beziehung: 



Tabelle 5.8: Beziehungen zwischen Lageparametem und Vertei- 
lungsform 



Symmetrisch 


Modus » Median = Mittelwert 


Linkssteil 


Modus < Median < Mittelwert 


Rechtssteil 


Mittelwert < Median < Modus 


Bimodal 


2 Modalwerte oder Modus viel 
> bzw. viel < Mittelwert 



Diese Feststellung führt dazu, dass es nur dann egal ist, welcher 
Lageparameter verwendet wird, wenn man es mit einer symmetri- 
schen eingipfligen Verteilung zu tun hat. In allen anderen Fällen 
reicht ein Lageparameter nicht aus. Einkommensverteilungen z.B. 
sind fast immer linkssteil, weil sie links begrenzt sind durch 0. Die 
Auswahl von Median oder Mittelwert ist dann sogar ein Politikum: 
wer den Median angibt, kann damit vom hohen Durchschnittsein- 
kommen ablenken, wer das Durchschnittseinkommen angibt, kann 
damit von der Masse der Ärmeren ablenken, wie man an der fol- 
genden grafischen Darstellung (Abbildung 5.9) sehen kann. 
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ft 

£25.000 



I 



£7.600 



ft« 

£5,500 



ft 

£3.472 Arithmetical «wage 

ftftft 

£3.500 

ftftftft 

£2.500 



£2,100 Median (th« on« ln !h« middle. 12 abov» him. 12 below) y-^v 

ftftftjjftj ftftftft« 9 

£1,400 Modo (occurs most froquontfy) 



Abbildung 5.9: Einkommensverteilung in einer Firma als Piktogramm 
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5.5. Transformationen 

Für statistische Auswertungen ist es oft notwendig, dass die Daten 
eine symmetrische oder sogar zusätzlich noch eingipflige Vertei- 
lung aufweisen. Wenn nun die erhobenen Daten eine Schiefe auf- 
weisen, ist es möglich, auf alle Daten eine mathematische Funkti- 
on anzuwenden und sie damit in einer nachvollziehbaren Weise zu 
verschieben, so dass sie dann die gewünschte Verteilungsform 
aufweisen. Eine solche Funktion heißt Transformation. 



Definition'. Eine Transformation von Daten ist die Anwendung 
einer mathematischen Funktion g auf alle Fälle eines Merkmals 
x ; zum Zweck einer Veränderung ihrer Verteilung (x, — > g( x,)). 
Als Transformationen sind nur monotone Funktionen geeig- 
net, die die Ordnungsrelation der Daten nicht verändern (x, < Xj 
<=> g(x ; ) < g(Xj)). Eine lineare Transformation besteht aus der 
Addition von Konstanten und/oder der Multiplikation mit einem 
Faktor. 



Bei der Erläuterung der Skalenniveaus wurde schon auf die erlaub- 
ten Transformationen der Skalen hingewiesen. „Erlaubt“ bedeutet 
dabei, dass nur bei solchen Transformationen das Skalenniveau 
erhalten bleibt. 

Beispiele: 

a) lineare Transformation: 

Xi -> g(xi) = 3,0 + 10,8 • x ; , allgemein Xj -> g(x £ ) = a + bx ; 

Spezialfall „Zentrierung“: Mit der linearen Transformation g(x,) = 
X; - X kann man erreichen, dass die ursprünglichen Daten in eine 
neue Variable mit derselben Häufigkeitsverteilungsform, aber mit 
Mittelwert 0 transformiert werden. Denn es gilt ja 
n 

^ (x; - X ) = 0, also auch 
i=i 

n n 

g(x) = 1/n ^ g(Xi) = 1/n ^ (X, - X ) = 1/n -0 = 0. 

i=i i=i 
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b) monotone Transformation: 

Sie wird meist zur „Umcodierung“ von kategorialen Daten ange- 
wendet, z.B. den Bildungsabschluss in „Bildungsjahre“ umcodiert: 
1 — > 8, 2 — > 10, 3 — » 12, 4 — > 13, 5 — > 20, ... 

Mit dieser Umcodierung bleiben der Modus und der Median 
gleich, nämlich bei derselben Ausprägung, wenn diese auch einen 
anderen Code hat. Der Mittelwert verändert sich jedoch beträcht- 
lich, eine solche Transformation ist aus diesem Grund für metri- 
sche Daten nicht angebracht. 



c) logarithmische Transformation: 

Xi -> g(Xj) = ln (x;) ( ln = logarithmus naturalis) 

d) Wurzeltransformation: 

X, -> g(Xi) = V (Xi) 




DAUER DER ARBEITSLOSIGKEIT IN WOCHEN 




LV42 



Abbildung 5.10: Dauer der Arbeitslosigkeit, absolut und logarithmiert. 



Logarithmus und Wurzeltransformation sind geeignet, um links- 
steile Verteilungen zu symmetrisieren. Die Dauer der Arbeitslo- 
sigkeit (Abbildung 5.10) ist ein Beispiel einer linkssteilen Vertei- 
lung. Logarithmiert ergibt sich eine im Prinzip eingipflige, fast 
symmetrische Verteilung. 
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5.6. Wachstumsraten 

Eine Logarithmierung von Daten ist insbesondere dann sinnvoll, 
wenn nicht ihre absoluten Werte, sondern ihre Verhältnisse inte- 
ressieren. Das ist z.B. dann der Fall, wenn die Frage, um wie viel 
Prozent sich Daten unterscheiden, wichtiger ist, als um wie viel 
Differenz sie sich unterscheiden. 

Eine solche Angabe wird oft in Wachstumsprozessen verwen- 
det, d.h. in Daten, die zeitliche Verläufe darstellen. Die „Fälle“ 
werden gebildet durch die Jahre, Monate oder Tage, für die die 
Merkmale erhoben wurden, sie erhalten deshalb den Index t (Fälle 
als Zeitpunkte t: x t ). Die Fälle haben also eine natürliche Ordnung 
durch den Zeitverlauf, und die Änderung der Daten in diesem 
Zeitverlauf ist von Interesse. Wachstum wird aber immer im Ver- 
hältnis zum bisherigen Zustand gemessen: man erwartet natürlich, 
dass ein Elefant in absoluten Kilogrammgewichten schneller 
wächst als eine Maus, weil das Körperwachstum relativ zur vor- 
handenen Körpermasse geschieht. Also interessiert der prozentuale 
Vergleich bzw. das Verhältnis aufeinander folgender Daten. Die- 
ses Verhältnis wird als Wachstumsrate bezeichnet: 



Definition : Die Wachstumsrate w t von zwei zeitlich aufeinan- 
derfolgenden Daten ist ihre relative Änderung 

w, = (x t+1 - x t ) / x, 



Das Datum des nächsten Zeitpunktes x t+l ist somit der letzte Zeit- 
punkt mal „Wachstumsrate + 1“ (auch der Wachstumsfaktor ge- 
nannt): 

x t+ i =x, + x t - w t = x,- (1 +w t ). 

Die folgende Tabelle 5.9 zeigt die Entwicklung einer 2-jährigen, 
(da die Daten hier ausnahmsweise nur in 2-Jahres-Abständen vor- 
liegen) Wachstumsrate aus dem Bildungssystem in der Bundesre- 
publik, die der Abiturientinnen. 
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Tabelle 5.9 : Abiturientenzahlen in der Bundesrepublik (mit 1980 

= 100 ) 



Jahr 




Formel 


Wachstums- 
rate (2-jähr.) 

Wl9„ 


1980 




(112-100)/100 


0,12= 12% 


1982 




(144-1 12)/1 12 


0,29 = 29% 


1984 




(139-144 )/144 


-0,03 = -3% 


1986 




(162- 139)/139 


0,17 = 17% 


1988 




(192-162)/162 


0,19= 19% 


1990 


192 







(Quelle: kumulierter ALLBUS 1980-1996) 



Wie man sieht, ergibt eine absolute Steigerung um den Wert 32 im 
Jahr 84 eine 29% - Rate und eine vergleichbare Steigerung um 30 
im Jahr 1990 nur eine Rate von 19%, wegen der inzwischen er- 
folgten Erhöhung des Basisjahres. Man kann den Wert des Jahres 
1990 berechnen, indem man den Wert von 1980 sukzessive mit 
den Wachstumsfaktoren multipliziert: 



x 1990 - X 1988(l+ W 1988) — x 1986( l+ w 1986)( 1 + w 1988) — 

= x 198()( 1 + w 198o)( 1 + w 1982)( 1 + w 1984)( 1 + w 1986)( 1 + w 1988) 

Wie war nun die durchschnittliche Steigerung in diesen 10 Jahren? 
Man will damit eine Rate ausrechnen, mit der man, wenn man sie 
ab 1980 jedes Jahr anwendet, im Jahr 1990 bei derselben Zahl 
ankommt wie in der Tabelle der tatsächlichen Daten. Um den 
Durchschnitt von Wachstumsraten zu berechnen, kann man nun 
nicht das arithmetische Mittel nehmen, denn für 1980-1984 z.B. ist 

0,5-((144— 1 12)/1 12 + (1 12-100 )/100) = 0,5-(0,12 + 0,29) = 0,205 
* 0,5-( 144 - 100)/100 = 0,22 

Folgende Überlegung hilft weiter: Durchschnittliche Wachstums- 
rate w d bedeutet, dass der Wachstumsfaktor immer gleich bleibt, 
d.h. damit ist 
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Xl990 

1+ W d 

1 + W d 

W d 



- x 198o( 1 +Wd)( 1 +W d )( 1 +W d )( 1 +W d )( 1 +W d )-Xi98o( 1 +W d ) 5 , 

d.h. 

= ( x 199o/Xl98o) 1/5 , also 

= (192/100) 1/5 = 1,92 1/5 = 5 V 1,92 = 1,139; damit 
= 0,139. 



Die durchschnittliche 2 - jährige Wachstumsrate in den 10 Jahren 
von 1980 bis 1990 beträgt damit 0,139 = 13,9 %. Diese Methode 
führt zur Definition des geometrischen Mittels: 



Definition : Sind wi, ...,w k nichtnegative Wachstumsraten, so ist 

ihr geometrisches Mittel 

g = (w r Wv...-W k ) 1/k . 



Das geometrische Mittel gibt die durchschnittliche Wachstumsrate 
im Zeitraum l,...,k an. 

W. Krämer (1992) weist auf die Gefahren hin, die man bei der 
Argumentation mit Wachstumsraten eingeht. Sei der Umsatz eines 
Unternehmens in drei aufeinander folgenden Jahren 
100, 101, 104 

so sind die folgenden Aussagen alle richtig: 

Umsatz um 2,97% gestiegen ( (104 - 10 1 J/10 1 = 0,0297) 

Umsatz um 4% gestiegen ( ( 104- 100)/100 = 0,04) 

Umsatz Wachstum um 197% fast explodiert! ( w, = 1, w 2 = 2,97, 
Steigerung um 197%) 

Der Unterschied vom ersten zum zweiten Fall besteht darin, dass 
einmal die einjährige und dann die zweijährige Wachstumsrate 
genannt wird. Im letzten Fall ist die Wachstumsrate der Wachs- 
tumsraten berechnet worden. Man muss schon genau lesen, um das 
herauszubekommen. Ein solcher Wert ist natürlich allein wenig 
sinnvoll. 

Weitere Literatur zu diesem Kapitel: Clauß u.a.: 36-46, Hochstäd- 
ter: 57-69, Krämer, Kühnel/Krebs: 76-83 
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Übungsaufgaben : 

1. Welche Lagemaße können sinnvoll berechnet werden für a) 
Lieblingsessen (Angabe des Gerichts), b) Ehedauer in Tagen, c) 
Besoldungsstufen der Beamten (Al bis A16), d) Schulabschluss? 

2. Gegeben sind Mittelwert, Median und Modus desselben Merk- 
mals in zwei Datensätzen. 





Modus 


Median 


Mittelwert 


Datensatz 1 
(N, = 100) 


3 


4 


5 


Datensatz 2 
(N 2 = 100) 


9 


9 


10 



Bestimmen Sie die entsprechenden Parameter für die Vereinigung 
der beiden Datensätze, wenn dies möglich ist. 





Kapitel 6: Streuungen 



Im vorangehenden Teil wurden Parameter, die die zentrale Lage 
der Werte eines Merkmals beschreiben, definiert. Hier geht es um 
Parameter, die die Streuung der Werte kennzeichnen. Mit beiden 
Angaben zusammen kann man sich schon ein ungefähres Bild 
einer Verteilung machen. Streuungs-Parameter sind Kennwerte, 
die die „Flachheit“ der Verteilung beschreiben: je größer der Pa- 
rameter, desto „flacher“ die Verteilung. Dabei spielt die Häufigkeit 
von Ausprägungen in Bezug auf ihre Lage eine Rolle - sind z.B. 
links „mehr“ Werte als rechts oder in der Mitte. Deswegen sind 
Streuungs-Parameter nur für mindestens ordinalskalierte Daten 
definiert. Für nominalskalierte Daten gibt es aber die Möglichkeit, 
ihre „Heterogenität“ zu messen (Kap. 6.5). 



6.1 Die Spannweite oder Variationsbreite 

Der einfachste Streuungsparameter ist die Spannweite. 

Definition : Spannweite, Variationsbreite ( R ) 

ist die Differenz von größtem und kleinstem Wert: 

R — ViilIX — Vmn 



Sie ist leicht bestimmbar und leicht verständlich, aber verändert 
sich bei der Hinzunahme neuer Werte und ist damit abhängig von 
N. Sie ist deshalb nicht zum Vergleich verschiedener Stichproben 
geeignet. Zu ihrer Berechnung werden zudem nur zwei Daten von 
allen vorhandenen benutzt, sie kann deshalb keine Auskunft über 
Variationsmuster in den Werten geben. 

Beispiel: Gegeben seien 5 Einkommenswerte 

1490, 1710, 1820, 1960, 2570. Dann ist R = 2570 - 1490 = 1080. 

V. Müller-Benedict, Grundkurs Statistik in den Sozialwissenschaften, 

DOI 10.1 007/978-3-53 1-93225-5_6, © VS Verlag für Sozialwissenschaften | 
Springer Fachmedien Wiesbaden GmbH 2011 
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6.2 Centile, Quartile, Quartilsabstand 

Etwas mehr Informationen aus den Daten werden bei der Berech- 
nung von Centilen benötigt. 



Definition: p-Centil Cp ist die Angabe der Merkmalsausprä- 
gung, bis zu der p lOOstel der der Größe nach geordneten Werte 
liegen. 



Die Centile sind im Grunde eine Verallgemeinerung des Medians. 
Der Median stellt nämlich natürlich genau das 50-Centil dar, d.h. 

Z = X = C 50 

Die Centile und den Median kann man grafisch gut an der kumu- 
lierten Verteilungsfunktion ablesen: 




ALTER: BEFRAGTE<R> 



Abbildung 6 . 1 : kumulierte Altersverteilung mit C10 und C90 



Die genauen Zahlen der kumulierten Altersverteilung aus den 
ALLBUS-Daten (Abbildung 6.1) für das 10- und das 90-Zentil 
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sind: Q 0 = 24 und C 90 = 69. 10% der Befragten waren jünger als 
oder gleich 24 Jahre, 90% waren jünger als oder gleich 69 Jahre. 

Es gibt eine allgemeine Beziehung zwischen dieser Art des 
Ablesens von Centilen aus der kumulierten Verteilungskurve und 
der relativen Häufigkeitsverteilung selbst. Die Formel für die 
Summe der relativen Häufigkeiten ergibt: 
n 

^ p(x;) = 1.0 

i=i 

Die Summe der kleinen „Stäbchen“, der Flächenstücke, in der 
Abbildung 6.2 wird insgesamt eins, wenn sie für jedes Alter als 
relative Häufigkeit (y-Wert geteilt durch N) gemessen werden. 



100 ' 




ALTER: BEFRAGTE<R> 



Abbildung 6.2: Histogramm der Altersverteilung (1 „Stäbchen“ = Häufigkeit eines 
Jahrgangs) 



Die kumulierte Verteilung F(x) gibt dann genau die Größe des 
Flächenstücks an, das vom Anfang bis zu x reicht. Die kumulierte 
Verteilung F(x) ist damit das „Integral“ der Häufigkeitsverteilung 
bis x (wenn sie fein genug unterteilt ist), und umgekehrt: die Häu- 
figkeitsverteilung ist das Differential, die Ableitung der kumulier- 
ten Verteilung. Da das 10%-Centil Qo = 24 ist, kann man deshalb 
auch so schreiben: F(24) = 0,1. 
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Einige Centile sind mit speziellen Begriffen belegt. 



Definition : Quartile sind die 25-, 50- und 75- Centile. Das 100- 
Centil = Cioo ist x max , das 50-Centil = C 50 ist das 2. Quartil Q 2 = 
Median, das 25-Centil das 1. Quartil Q x und das 75-Centil das 

3. Quartil = Q 3 . 



Da diese Definition sich nur auf die der Größe nach geordneten 
Fälle bezieht, ist sie insbesondere auch für Ordinalskalenniveau 
geeignet. Als Maß für die Streuung ordinalskalierter Daten eignet 
sich dann der Abstand des ersten und dritten Quartils, der sog. 
Quartilsabstand. 



Definition : Der mittlere Quartilsabstand Q A (im Folgenden 
immer ohne „mittlere“ gebraucht; englisch: Semi- IQR = Semi 
- InterQuartile Range) ist 

n _ I Q3 ~Qi I 
Q» 2 



Der Quartilsabstand kann leicht ermittelt werden und ist, wie der 
Median, robust gegenüber Extremwerten. Allerdings berücksich- 
tigt er ebenfalls nicht alle Werte, die zur Verfügung stehen, und 
wird nicht immer einheitlich definiert. Abbildung 6.3 zeigt ein sog. 
Boxplot, das mit Hilfe der Spannweite, der Quartile und des Medi- 
ans eine rudimentäre Beschreibung einer Häufigkeitsverteilung 
ermöglicht. 



Xmin Ql Z Q3 



X max 



Abbildung 6.3: „Boxplot" mit x m jn, Qi, Z, Q 3 , x max 
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Das Problem bei der genauen Definition ist die Festlegung des 
Rangplatzes des Falls, der den Wert eines Quartils liefert. Wenn 
man viele Fälle im Datensatz hat (n > 100), werden folgende 
Rangplätze der der Größe nach aufsteigend geordneten Fälle ange- 
nommen: Qi ist der Wert des Falls mit dem Rangplatz (n+3)/4, Q 3 
der mit dem Rangplatz (3n+l)/4. Diese Formeln dienen dazu, den 
Rangplatz bei nicht durch 4 teilbaren Datensätzen zu berechnen. 



Tabelle 6.1: Schulabschluss Männer und Frauen (ALLBUS 1994) 



Frauen 





Häufigkeit 


Prozent 


Gültige 

Prozente 


Kumulierte 

Prozente 


Gültig KEIN ABSCHLUSS 


43 


2,5 


2,6 


2,6 


VOLKS-, HAUPTSCHULAB 


837 


49,0 


49,7 


52,2 


MITTL. REIFE, REALSCH. 


528 


30,9 


31,3 


83,6 


FACHHOCHSCHULREIFE 


62 


3,6 


3,7 


87,2 


ABITUR, HOCHSCHULREI. 


215 


12,6 


12,8 


100,0 


Gesamt 


1685 


98,6 


100,0 





Männer 





Häufigke 

it 


Prozent 


Gültige 

Prozente 


Kumulierte 

Prozente 


Gültig KEIN ABSCHLUSS 


31 


1,8 


1,8 


1,8 


VOLKS-, HAUPTSCHULAB 


813 


46,7 


47,5 


49,4 


MITTL.REIFE, REALSCH. 


489 


28,1 


28,6 


78,0 


FACHHOCHSCHULREIFE 


102 


5,9 


6,0 


83,9 


ABITUR, HOCHSCHULREI. 


275 


15,8 


16,1 


100,0 


Gesamt 


1710 


98,2 


100,0 





Beispiel: Quartilsabstand Männer und Frauen (s. Tabelle 6.1), 
Berechnung der Quartile, Frauen: 

Ql: (n+3)/4 = (1685+3)/4 = 422ter Fall => Ql = Hauptschule 
Q3: (3n+l)/4 = (3-1685+l)/4 = 1265ter Fall => Q3 = Realschule 
Berechnung der Quartile, Männer: 

Ql: (n+3)/4 = (1710+3)/4 = 428,25 « 428ter Fall => Ql = Haupts. 
Q3: (3n+l)/4 = (3-1710+Q/4 = 1282,8 =1283ter Fall => Q3 = Rs. 



Der Quartilsabstand beträgt damit bei beiden Geschlechtern eine 
halbe Bildungsstufe. In Worten ausgedrückt: Innerhalb der 50% 
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Personen mit den „mittleren“ Bildungsabschlüssen gibt es nur eine 
maximale Differenz von einer Bildungsstufe. 



Exkurs: Schätzung des Quartilsabstands bei wenigen Ausprä- 
gungen. 

Die Angabe des Quartilsabstands auf diese Weise ist unge- 
nau, wenn man es mit einem Merkmal mit nur wenig Werten zu 
tun hat. Der Vergleich der Frauen und Männer bzgl. der Streu- 
breite der Bildungsabschlüsse ergibt keinen Unterschied, wenn 
man die obige Definition (die auch die von SPSS ist) nimmt. 
Auch wenn man die Kategorien fortlaufend vercodet: Haupt- 
schule = 1, ..., Abitur = 5, ergibt sich in Zahlen derselbe Quar- 
tilsabstand, nämlich 1/2 = (3-2)/2. Mit diesen Codes kann der 
Quartilsabstand aber auch als künstlicher Wert berechnet wer- 
den, der nicht eine Ausprägung der Daten, d.h. ein bestimmte 
Bildungsstufe, darstellt, sondern auch irgendwo dazwischen 
liegen kann. Dabei wird von der obigen Berechnung ausgegan- 
gen, aber innerhalb der Kategorien weiter interpoliert. 

Es gibt 837 Frauen mit Kategorie 2. Die erste hat den Rang- 
platz 44. Dann hat die 422., deren Ausprägung das 1. Quartil 
darstellt, nach der Interpolationsformel (s. Exkurs S. 70) den 
Wert 

Ql = 2 + (422-43)/837 = 2, 453. 

Ebenso gilt für das 3. Quartil: 

Q3 = 3+(1265-837-43)/528 = 3,729, 

bzw. für die Männer 

Ql = 2 + (428-3 1)/8 13 = 2,473, 

Q3 = 3 + (1283-81 3-3 1)/489 = 3,898. 

Berechnet man den Quartilsabstand mit diesen interpolierten 

Quartilswerten, dann ergibt sich 

Q a (Frauen) = (3,729-2,453)/2 = 0,638 und 

Q a (Männer) = (3,898 - 2, 473)/2 = 0,713 

Die Männer haben mit der Interpolationsmethode einen etwas 

größeren Quartilsabstand, was ja auch intuitiv zu erwarten ist, 

da sie mehr nach oben, in die Kategorien Fachhochschule und 

Abitur, streuen. 
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Ebenso wie Modus und Median kann auch die Lage der Quartile 
Aufschluss Uber die Verteilungsform geben. So zeigen die in Ta- 
belle 6.2 von SPSS berechneten ersten und dritten Quartile der 
Alterverteilung, dass sie leicht linkssteil ist. 

Tabelle 6.2: Quartile und Median der Altersverteilung 



Statistiken 

ALTER: BEFRAGTE<R> 



N Gültig 


3446 


Fehlend 


4 


Median 


44,00 


Perzentile 25 


31,00 


50 


44,00 


75 


59,00 



Der Quartilsabstand dient ebenfalls oft dazu, genauer zu definie- 
ren, was „Ausreißer“ und „Extremwerte“ sind. So definiert z.B. 
SPSS Extremwerte als Werte, die mehr als 3 Quartilsabstände 
außerhalb der mittleren 50% liegen (mit * gekennzeichnet), und 
Ausreißer als Werte, die mehr als 1,5 Quartilsabstände außerhalb 
liegen (mit o gekennzeichnet) (s. Abbildung 6.4). 




GESCHLECHT, BEFRAGTE<R> 



Abbildung 6.4: SPSS - Boxplot der Einkommensverteilung für Männer und Frauen 
Erläuterung mit Berufsangabe für Ausreißer- und Extremwerte (Stichprobe 
von 8% aus ALLBUS 94). 
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Man sieht in dieser Abbildung, dass auch für metrische Daten wie 
das Einkommen eine Bestimmung des Quartilsabstands, der Lage 
der Quartile, des Medians und der Ausreißer durchaus einen Sinn 
macht, um einen Überblick über die Daten zu erhalten. Aus einem 
Boxplot kann man andere Schlüsse ziehen, als mit einem Ver- 
gleich der beiden Histogramme dieser Einkommensverteilung 
(Abbildung 6.5, V264 in ALLBUS 94). Bei ihnen erkennt man 
nicht auf den ersten Blick die Unterschiede in der Streuung zwi- 
schen Männern und Lrauen in Bezug auf das Einkommen. Beide 
Methoden weisen aber auf dieselbe linkssteile Verteilungsform 
hin. 

Männer Frauen 





BEFR.: NETTOEINKOMMEN, OFFENE ABFRAGE BEFR.: NETTOEINKOMMEN, OFFENE ABFRAGE 

Abbildung 6.5: Nettoeinkommen von Männern und Frauen 



6.3 Varianz, Standardabweichung, Variationskoeffizient 

Ein weiterer Streuungskennwert, der intuitiv einsichtig ist, ist die 
durchschnittliche Abweichung, d.h. der durchschnittliche Abstand, 
den die Fälle vom Median haben. 



Definition: Durchschnittliche Abweichung MAD (Mean Ab- 
solute Deviation) ist definiert als 
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Man könnte die durchschnittliche Abweichung auch mit irgendei- 
nem anderen Wert a anstelle des Medians X in den Summanden 
berechnen. Es lässt sich aber zeigen, dass der Median genau der 
Wert ist, der den kleinsten Abstand zu allen Daten gleichzeitig hat 
(s. Kap. 5.2). Damit ist der Median in dieser Formel besser geeig- 
net als etwa der Mittelwert, wie man vielleicht auch annehmen 
könnte. 

Beispiel: Gegeben seien fünf Einkommenswerte 
1490, 1710, 1820, 1960, 2570. 

Dann ist X = 1820 und 

MAD = (1 1490- 1 8201+1 1 710-1 8201+0+1 1 960- 1 8201+12570- 1 820l)/5 
= (330+ 110 + 0+ 140 + 7 5 0)/5 = 266. 

Als Vorteil gegenüber dem gleich folgenden Parameter der Vari- 
anz kann gelten, dass die MAD von Extremwerten nicht so stark 
beeinflusst wird. Wegen des Absolut-Betrags ist sie jedoch un- 
handlich auszurechnen, und wegen der Benutzung des Medians 
nicht leicht mit dem Mittelwert statistisch kombinierbar. Sie wird 
wegen der mathematischen Nachteile deshalb wenig angewendet. 

Der Wert, der am häufigsten für die Streuungsbeschreibung 
benutzt wird, ist die Varianz. Sie kommt dadurch zustande, dass 
das „Residuum“ jedes Datums (sein Abstand vom Mittelwert) jetzt 
vor der Summierung quadriert wird. 



Definition : Die Varianz s 2 eines Datensatzes ist definiert als 



1 



n-1 



S(x,-xF 



Der zweite Term wird deshalb als „Summe der Abstandsquadrate“ 
(SAQ) bezeichnet, und es gilt: 

n n 

SAQ=^ (xi-X) 2 =^ X; 2 - n X 2 ; s 2 = l/(n-l) • SAQ. 

i=i i=i 

Da die Abstände im Quadrat in diese Formel eingehen, werden 
kleine Abstände (< 1) durch Quadrieren noch kleiner gemacht und 
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haben wenig Einfluss auf die Summe, während große Abstände 
durch das Quadrieren noch erheblich an Bedeutung für die Summe 
gewinnen. Die SAQ und damit auch die Varianz ist deshalb, genau 
wie auch der Mittelwert, nicht robust gegenüber Ausreißern. 

Man findet ebenfalls dieselbe Definition mit 1/n als erstem 
Term. Das ist auch einleuchtender, wenn man den Durchschnitt 
aus den Abweichungen von allen n Daten berechnen will. Aber der 
Faktor l/(n-l) ist immer dann angebracht, wenn die Daten eine 
Stichprobe darstellen und keine Vollerhebung. Denn dann soll die 
Varianz, die aus den Daten der Stichprobe berechnet wird, immer 
eine Schätzung der Varianz der Grundgesamtheit darstellen. Und 
diese aus der Stichprobe zu schätzende Varianz der Gesamtheit 
aller Daten, aus denen die Stichprobe gezogen wurde, wird genau- 
er geschätzt mit dem Faktor l/(n-l) vor den SAQ. 

Ab diesem Punkt wird es deshalb wichtig, immer etwas ge- 
nauer zu differenzieren, ob man es mit einer Stichprobe, d.h. mit 
Daten zu tun hat, aus denen Verallgemeinerungen erschlossen 
werden sollen, oder nicht, ohne an dieser Stelle schon genau defi- 
nieren zu können, wie eine Stichprobe genau definiert ist. Keine 
Stichprobe kann dabei bedeuten, dass entweder alle in Frage 
kommenden Forschungsobjekte erfasst sind, also eine Totalerhe- 
bung, wie etwa die Volkszählung, oder es kann auch bedeuten, 
dass eine theoretische Verteilung betrachtet wird, die nicht aus 
Daten, sondern aus mathematischen Formeln hergeleitet wurde. 

Für die weiteren Teile dieses Buchs gilt, dass in Zukunft latei- 
nische und kleine Buchstaben für Stichproben und griechische 
bzw. große lateinische Buchstaben für theoretische Verteilungen 
verwendet werden sollen. Das s 2 (lateinisch) bedeutet also: Vari- 
anz einer Stichprobe, während für eine Totalerhebung gilt: 

N 

<r = l/N ^ ( x, - p) 2 

i=i 

(c = griechisch „sigma“, p = griechisch „my“). 

Beispiel: die Varianz der obigen Einkommens werte 
1490, 1710, 1820, 1960, 2570. Dann ist X = 1910 und 
SAQ = (1490- 1 9 10) 2 + (1710-191 0) 2 + (1820-1910) 2 + (1960- 
1910) 2 + (2570-1910) 2 
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= (-420) 2 + (-200) 2 + (-90) 2 + 50 2 + 660 2 = 176400 + 

40000 + 8100 + 2500 + 435600 = 662600, 
s 2 = 662600/4= 165650. 

Der Wert der Varianz ist viel größer als die Daten selbst, weil die 
Daten eben quadratisch in die Varianz eingehen. Ebenso ist die 
Dimension der Varianz eine quadrierte Dateneinheit, also z.B. 
Euro 2 bei Einkommensdaten. Um eine bessere Interpretation zu 
erreichen und um der Streuung auch eine anschauliche Bedeutung 
geben zu können, wird aus der V arianz eine weitere Größe berech- 
net, mit der die Streuung in ganz analoger Weise angegeben wer- 
den kann, die Standardabweichung s. 



Definition : Standardabweichung s ist die Wurzel aus der Vari- 
anz: S = y[s* 



Die Standardabweichung der obigen Daten ist damit V 1 65650 = 
407,00 Euro und damit eine Maßzahl, die in der Größenordnung 
der Daten liegt. Die Tabelle 6.3 zeigt die Standardabweichung und 
alle anderen bisher berechneten Parameter für die Einkommens- 
verteilung von Männern und Frauen aus der obigen Grafik. 

Die Standardabweichung kann man als Wert direkt in die Ver- 
teilung einzeichnen. Die Standardabweichung umfasst in irgendei- 
ner Weise die „Mitte“ der um den Mittelwert als Berg verteilten 
Daten. Man kann sie deshalb symmetrisch um den Mittelwert 
einzeichnen, auch wenn, wie in Abbildung 6.6, eine linkssteile und 
daher nichtsymmetrische Verteilung vorliegt. 
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Tabelle 6.3: Lage- und Streuungsparameter der Einkommensver- 
teilung (berechnet ohne Einkommen = 0) 



Statistiken 



BEFR.: NETTOEINKOMMEN, OFFENE ABFRAGE 



MANN N Gültig 

Fehlend 

Mittelwert 

Median 

Standardabweichung 

Varianz 

Spannweite 

Perzentile 25 

50 
75 


1001 

740 

2390,45 

2200,00 

1315,52 

1730603 

12300 

1500.00 

2200.00 
3000,00 


FRAU N Gültig 

Fehlend 

Mittelwert 

Median 

Standardabweichung 

Varianz 

Spannweite 

Perzentile 25 

50 
75 


951 

758 

1454,49 

1250,00 

850,09 

722655,85 

5920 

850,00 

1250.00 

2000.00 




Abbildung 6.6: Einkommensverteilung Männer mit Mittelwert und Standardabwei- 
chung 
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Für den Mittelwert gilt bzgl. der Varianz ein ähnlicher Satz wie für 
den Median: 

n n 

^ ( x, - X ) 2 < ^ (xi - a) 2 für beliebiges a, genauer gilt 

i=i i=i 

X (V- X) 2 = J (x,-a) 2 -n(X - a) 2 
i=i i=i 

(Beweis Hochstädter: 83), so dass nur für a = X die rechte Ab- 
standsquadratsumme minimal wird. Wenn man die Abstände der 
Daten voneinander nicht als ihre Differenz, sondern als ihre quad- 
rierte Differenz misst, dann ist der Mittelwert genau der Wert, der 
von allen anderen Werten gleichzeitig den kleinsten (quadrierten) 
„Abstand“ hat. Physikalisch gesehen, bildet der Mittelwert wegen 
dieser Formel den „Schwerpunkt“ der Daten, der die Werte links 
und rechts von sich gewichtsmäßig austariert. 

In Kapitel 5.5 wurden Transformationen von Daten beschrie- 
ben. Die Zentrierung ist die Differenz der einzelnen Daten vom 
Mittelwert. Sie hat den Effekt, dass der Mittelwert der transfor- 
mierten Daten Null ist. Nun kann mit Hilfe der Standardabwei- 
chung eine weitere Transformation der Daten vorgenommen wer- 
den, um zu erreichen, dass die Daten den Mittelwert 0 und die 
Standardabweichung 1 besitzen. Die Transformationsformel lautet: 



Definition : Eine Standardisierung, standardisierende Trans- 
formation von Daten ist die Transformation 

x , = x^X 

s 



Beispiel: 

1490, 1710, 1820, 1960, 2570. Dann ist X = 1910, s = 407 

X] ' = (1490 - 1910)/407 = -1,03 

x 2 '= (1710- 1910)/407 = -0,49 

x 3 = ( 1 820- 191 0)/407 = -0,22 

x 4 '= (1960-1910)7407 = 0,12 
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x 5 '= (2570- 1 9 10)/407 = 1,62 und es ergibt sich 
X ' = 0,000, 

s 2 ' = ((-1,03) 2 + (-0,49) 2 + (-0,22) 2 + (0,12) 2 + l,62) 2 )/4 = 1 . 

Da sowohl Standardabweichung als auch Varianz in ihrer Größen- 
ordnung sehr von dem durchschnittlichen Wert der Daten abhän- 
gen - eine einfache Verschiebung der Daten um den Wert 100 
bewirkt für jeden SAQ-Summand 10000 mehr! - kann man die 
Streuung von Datensätzen mit verschiedenen Mittelwerten nicht 
gut miteinander vergleichen. Man kann für diesen Fall den sog. 
Variationskoeffizient bilden. 



Definition : Der Variationskoeffizient V ist definiert (nur für 
rationalskalierte nichtnegative Daten) als 

V = = -100 
X 



Er eignet sich zum Vergleich von Streuungen. Als Beispiel diene 
der Vergleich der Einkommensstreuung der Männer und Frauen 
aus den obigen Daten: 

V Frauen = 850,09/ 1454,49 = 0,584 

V Männer = 1351,52/2390,45 =0,565 

Bei Männern und Frauen ist also eine etwa gleich große Streubrei- 
te an Einkommen vorhanden, wenn man berücksichtigt, dass die 
Frauen ein im Durchschnitt geringeres Einkommen erzielen. 



Exkurs 

6.4 Momente 

Wenn man sich die Formeln für Mittelwert und Varianz ansieht, 
so kann man dabei eine gewisse Vorschrift feststellen, wie die 
Formeln gebildet werden. Diese Vorschrift kann man fortset- 



zen: 
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n 



i=1 


(xj- X) = 0 


: Abweichung vom Mittelwert 


1/H t 

i=1 


(N- X) 2 


: quadrierte Abweichung: Varianz 


1/H t 

i=1 


( Xl - X) 3 


: Schiefe (Skewness) einer Verteilung 


1/H t 

i=1 


(xi-X) 4 


: Kurtosis , Wölbung oder Exzess einer 
Verteilung 



Diese weiteren Summen haben jeweils eine zusätzliche Bedeu- 
tung für die Beschreibung einer Häufigkeitsverteilung. Die drit- 
te Summe beschreibt die Schiefe: Sie wird positiv, wenn die 
Verteilung linkssteil, und negativ, wenn die Verteilung rechts- 
steil ist. Die vierte Summe beschreibt die Wölbung, auch Kur- 
tosis genannt. Ist die Kurtosis < 3, so ist die Verteilung mehr 
nach außen, ist sie > 3, so ist sie mehr nach innen hin gewölbt 
als die Normalverteilung (s. nächstes Kap.). Diese Größen wer- 
den ebenfalls von SPSS ausgegeben. Im Prinzip lassen sich 
durch Fortsetzung dieses Prinzips alle Gestaltmöglichkeiten ei- 
ner Häufigkeitsverteilung auch mit diesen sog. Momenten be- 
schreiben. 



6.5 Ein Maß für die Heterogenität nominalskalierter Variable: 
Simpsons D 

Bei nominalskalierten Merkmalen, die keine Größer-Kleiner- 
Relation kennen, ist die Form ihrer Häufigkeitsverteilung nicht 
festgelegt: wenn man etwa im Balkendiagramm der Religionsver- 
teilung (Abbildung 4.1) zwei Kategorien vertauscht, erhält man 
einen anderen Eindruck von der "Streuung" dieses Merkmals. 
Dennoch kann man mit Hilfe einer anderen Eigenschaft Unter- 
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schiede in der Verteilung nominalskalierter Merkmale erkennen: 
man kann entscheiden, ob die Fälle sich eher auf alle Ausprägun- 
gen gleichmäßig verteilen oder ob sie eher auf eine oder wenige 
Ausprägungen "konzentriert" sind. Man kann das auch eher "hete- 
rogen" oder eher "homogen" nennen. Ein Maß, das das Ausmaß 
der Heterogenität misst, wird deshalb die relativen Häufigkeiten 
der Ausprägungen vergleichen. Je mehr diese sich gleichen, d.h. je 
näher die Verteilung einer Gleichverteilung kommt, desto weniger 
kann man die Ausprägung eines Falles einschätzen, desto hetero- 
gener ist das Merkmal verteilt. Je größer dagegen die relative Häu- 
figkeit der Modalkategorie ist, desto eher liegt ein beliebiger Fall 
auch in dieser häufigsten Kategorie, desto mehr ist das Merkmal 
auf den Modus konzentriert. Das Maß sollte deshalb - analog zu 
den Streuungsmaßen - einen größeren Wert für den ersteren Fall 
der größeren Heterogenität und einen kleineren Wert bei mehr 
Homogenität haben. Ein Maß, das diese Werte ergibt, ist das Fol- 
gende: 



Definition: Ein Maß für die Heterogenität nominalskalierter Da- 
ten ist Simpson's D 



D = 



k-1 



i-ZPi 



i=i 



j 



dabei ist k = Anzahl der Ausprägungen, pj = relativeHäufigkeit 
der Ausprägung i. 



D wird offenbar 0 genau dann, wenn alle Fälle in der Modalkate- 
gorie sind und 1 genau dann, wenn alle Ausprägungen dieselbe 
Häufigkeit haben, die dann jeweils 1/k ist. Statt Heterogenität wird 
auch der Begriff der "Entropie" oder der "Information" gebraucht, 
die mit anderen Formeln definiert sind, aber ebenfalls um so grö- 
ßer werden, je näher eine Häufigkeitsverteilung der Gleichvertei- 
lung kommt. 

Als Beispiel in Tabelle 6.4 die Häufigkeitsverteilung der 
Ethnien in den USA: 
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Tabelle 6.4: Ethnische Verteilung in den USA (Variable „Race 
im GSS = General Social Survey der USA 1 991 ) 



Race of Respondenl 





Häufigkeit 


Prozent 


Gültige 

Prozente 


Kumulierte 

Prozente 


Gültig White 


1264 


83,3 


83,3 


83,3 


Black 


204 


13,4 


13,4 


96,8 


Other 


49 


3,2 


3,2 


100,0 


Gesamt 


1517 


100,0 


100,0 





Simpsons D errechnet sich dann wie folgt: 

D = 3/2 • ( 1 - 0,833 2 - 0,134 2 - 0.032 2 ) = 0,4365 

Der absolute Wert von D ist schwer zu interpretieren, wenn D 
nicht nahe 0 oder 1 ist. Zwei nominalskalierte Merkmale lassen 
sich jedoch mit D gut daraufhin vergleichen, welches heterogener 
ist. 



6.6 Ein Streuungswert für bivariate metrische Verteilungen: 
die Kovarianz 

Bisher wurde nur die Streuung einer einzigen Variablen betrachtet. 
Es gibt aber ebenfalls Streuungsmaße für bivariate Verteilungen. 
Die gemeinsame Verteilung von zwei Variablen stellt dar, welche 
Beziehung zwischen beiden besteht, d.h. wie stark sie Zusammen- 
hängen. Die statistische Analyse des Zusammenhangs von zwei 
Variablen benötigt allerdings noch mehr Voraussetzungen und 
erfolgt deshalb erst ab Kap. 10. An dieser Stelle können jedoch 
schon in einem ersten Schritt Streuungsmaße berechnet werden. 
Die Streuungsmaße fassen eine bivariate Verteilung in einer Maß- 
zahl zusammen. 

Das Streuungsmaß für eine bivariate Verteilung von zwei met- 
rischen Variablen ist die Kovarianz. Die Darstellung der bivariaten 
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Verteilung von zwei metrischen Variablen erfolgt in einem Streu- 
diagramm (s. Kap. 4.5). Die Kovarianz misst die Streubreite in 
einem Streudiagramm. Dieses Maß wird später weiter behandelt, 
um die Korrelation zu definieren (Kap. 12.2). 

In einem Streudiagramm kann man den Zusammenhang beider 
Variabler erkennen. Abbildung 6.7 stellt die Alterskombination der 
beiden ersten in den Haushalten befragten Personen dar (V37, 
V268 ALLBUS98). Man erkennt, dass für die größere Zahl der 
Fälle diese beiden Personen etwa gleich alt sind. 




ALTER: BEFRAGTE<R> 

Abbildung 6.7: Streudiagramm mit Quadranten 



Wenn man in dieses Streudiagramm die Mittelwerte der beiden 
Variablen einträgt, kann man vier Bereiche, die sog. Quadranten I 
bis IV, bilden, die sich nach den Vorzeichen der Abweichungen 
der Variablen von ihren jeweiligen Mittelwerten X und Y und der 
Produkte dieser Abweichungen unterscheiden: 



Quadrant I: 
Quadrant II: 
Quadrant III: 
Quadrant IV : 



x; > X , yi > Y , Produkt (x, — X ) (y, - Y ) > 0 

x; < X , y t > Y , Produkt (x ; - X ) (y, - Y ) < 0 

x; < X , y t < Y , Produkt (x ( - X ) fyi — Y ) > 0 

x; > X , y t < Y , Produkt (x ; - X ) (y, - Y ) < 0 
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Wenn man nun die Summe aller dieser Produkte bildet und sie s xy 

nennt, dann gilt folgendes: 

- wenn die Punkte hauptsächlich in den Quadranten I und III 
liegen, ist s xy positiv 

- wenn die Punkte hauptsächlich in den Quadranten II und IV 
liegen, ist s xy negativ 

- je mehr die Punkte gleichmäßig in allen Quadranten verteilt 
sind, desto weniger weicht s xy positiv oder negativ von 0 ab. 

Diese Beobachtung führt zur Definition der Kovarianz: 



Definition : Die Kovarianz s xy zweier Variablen X und Y ist 
definiert durch 

s xy=-^T-Z( x i-X)(y I -Y) 

n-1 — ' 



Die Kovarianz ist damit ein Maß, das Auskunft über die Gestalt 
und Lage der Punktwolke des Streuungsdiagramms, d.h. der biva- 
riaten Verteilung gibt. Ein Streuungsmaß für eine univariate Ver- 
teilung kann nur angeben, ob die Daten enger oder weiter um den 
mittleren Wert streuen. In Erweiterung dieser Möglichkeit enthält 
ein Streuungsmaß für eine bivariate Verteilung zwei Angaben: 
ebenfalls die engere oder breitere Streuung um den Mittelpunkt, 
d.h. die Breite der Punktwolke, und zweitens die Lage bzw. die 
Hauptrichtung der Punktwolke im Raum der zwei Dimensionen. 

Genau das tut die Kovarianz: je näher sie dem Betrag nach - 
positiv oder negativ - an 0 ist, desto gleichmäßiger sind die Daten 
verteilt, und umgekehrt je größer sie insgesamt dem Betrag nach 
ist, desto eher sind die Daten auf einer diagonalen Linie konzent- 
riert. Auf einer diagonalen Linie konzentriert zu sein, bedeutet 
aber für den Zusammenhang der beiden Merkmale, dass man von 
einem Merkmal auf das andere schließen kann. Die Kovarianz ist 
deshalb umso größer, je mehr die beiden Merkmale Zusammen- 
hängen. 

Und zweitens kann die Kovarianz die Lage angeben: Ist sie 
positiv, dann sind die meisten Daten in Quadrant I und III, d.h. 
wenn ein Fall im Merkmal X über dem Mittelwert aller Fälle liegt, 
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dann auch im Merkmal Y. Umgekehrt ist es, wenn die Kovarianz 
negativ ist: dann ist eine über dem Mittelwert liegende Ausprä- 
gung im Merkmal X immer mit einer unter dem Mittelwert liegen- 
de Ausprägung in Y verknüpft, und die Daten liegen hauptsächlich 
in den Quadranten II und IV. Das Streudiagramm in Abbildung 6.7 
zeigt die Mehrzahl der Daten in den Quadranten I und III, die 
Kovarianz ist positiv. 

Die folgende Grafik (Abbildung 6.8) zeigt das Streudiagramm 
der Alterskombination von Ehepartnern (wie Abb. 6.7, zusätzlich 
Einschränkung auf Ehepartner V271 ALLBUS98). 



100 




0 20 40 60 80 100 

ALTER: BEFRAGTE<R> 

Abbildung 6.8: Alterskombination Ehepartner 



Die Kovarianz ist positiv, die Punkte liegen vor allem im I. und III. 
Quadranten: je höher das Alter des oder der Befragten, desto höher 
im Allgemeinen auch das Alter seines/ihres Ehepartners. Und die 
Punktwolke ist ausgeprägt auf eine Diagonale konzentriert, dieser 
Zusammenhang ist also stark. 

Der genaue Wert der Kovarianz ist jedoch sehr davon abhän- 
gig, in welchen Einheiten die Variablen gemessen werden. Würde 
das Alter z.B. in Monaten gemessen, erhöhte sich der Wert der 
Kovarianz um 12 2 = 144. Der absolute Wert der Kovarianz taugt 
also nur bedingt zur Messung der Zusammenhangsstärke. Wie 
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dieses Problem, das alle Maße, die die Stärke eines Zusammen- 
hangs messen, betrifft, allgemeiner gelöst wird, zeigt Kapitel 10.1, 
und wie die Kovarianz dafür weiter verwendet wird, Kapitel 12.2. 



6.7 Ein Streuungswert für bivariate dichotome Verteilungen: 
die Prozentsatzdifferenz 

Die bivariate Verteilung von kategorialen Variablen wird in 
Kreuztabellen dargestellt. Eine Maßzahl für die „Streuung“ inner- 
halb einer Kreuztabelle sollte, wie die Kovarianz bei metrischen 
Daten, messen, wie stark beide Variablen Zusammenhängen. Da es 
aber bei nominal skalierten Merkmalen keinen Referenzpunkt wie 
den Mittelwert bei metrischen Daten gibt, müssen solche Maße auf 
andere Weise konstruiert werden. Die Konstruktionen stützen sich 
meist auf den wahrscheinlichkeitstheoretischen Begriff der Unab- 
hängigkeit. Sie werden deshalb erst nach der Einführung in die 
mathematische Wahrscheinlichkeit (Kap. 8) ab Kap. 10. definiert. 

Für zwei dichotome Variable kann jedoch ein solches Maß in 
Fortführung der Diskussion in Kap. 4.5 über die bedingten Vertei- 
lungen in Kreuztabellen definiert werden. Eine Kreuztabelle für 
zwei dichotome Variable hat nur vier Felder, sie wird Vierfelderta- 
fel genannt (Tab. 6.5) und besitzt eine spezielle Notation, in der 
die Zelleninhalte mit kleinen Buchstaben bezeichnet werden: 



Tabelle 6.5: Notation einer Vierfeldertafel 





yi 


yi 


E 


Xi 


a 


b 


a+b 


X2 


c 


d 


c+d 


E 


a+c 


b+d 


a+b+c+d 



Als Beispiel dienen im Folgenden zwei Tabellen aus einer Unter- 
suchung zum Zusammenhang von Fernsehsendungen und Ge- 
schlecht (Röser 1995). Frauen und Männer wurden befragt, welche 
Fernsehsendungen sie gerne sehen. Für Nachrichten und für 
Sportsendungen ergaben sich diese zwei Tabellen (Tabelle 6.6): 
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Tabelle 6.6: Fernsehsendungen und Geschlecht (absolute Zahlen) 



Nachrichten sehen gern 


ja 


nein 


Summe 


Frauen 


90 


10 


100 


Männer 


47 


3 


50 


Summe 


137 


13 


150 



Sport sehen gern 


ja 


nein 


Summe 


Frauen 


31 


69 


100 


Männer 


33 


17 


50 


Summe 


64 


86 


150 



Offenbar werden Nachrichtensendungen etwa gleich gern gesehen 
von Frauen und Männern, während bei Sportsendungen eindeutig 
die Männer ihre Präferenzen haben. Die bedingte Verteilung von 
Frauen und Männern für jeweils die beiden Gruppen der „Gern-“ 
und „Nichtgern-Seher“ ist in etwa gleich bei Nachrichten, aber 
genau umgekehrt bei Sport. 

Das Streuungsmaß, das aus den bedingten Zeilen- oder Spal- 
tenprozenten berechnet werden kann, ist die Prozentsatzdifferenz. 
Berechnet werden die absoluten Differenzen der nach der unab- 
hängigen Variablen bedingten prozentualen Häufigkeiten (Prozen- 
tuierung auf xj für eine Ausprägung der abhängigen Variable. 



Definition: Die Prozentsatzdifferenz d (für Vierfeldertafeln) 
ist 

d = I a -100/(a+b) - c ■100/(c+d)l = Ib 100/(a+b) - d -100/(c+d)l 



Für die Berechnung der Prozentsatzdifferenz der Fernsehbeteili- 
gung in den obigen Tabellen ist als erstes festzulegen, welches die 
unabhängige Variable sein soll. Da das Geschlecht nicht beein- 
flussbar ist, ist es offenbar bei dieser Fragestellung die unabhängi- 
ge Variable. Also werden in der Tabelle die Prozentwerte der be- 
dingten Verteilung mit Geschlecht als unabhängiger Variable be- 
rechnet: 



























115 



Tabelle 6.6 (Forts.): Fernsehsendungen und Geschlecht in Prozent 



Nachrichten sehen gern 


ja 


nein 


Summe 


Frauen 


90,0 


10,0 


100,0 


Männer 


94,0 


6,0 


100,0 


Summe 


91,3 


8,7 


100,0 



Sport sehen gern 


ja 


nein 


Summe 


Frauen 


31,0 


69,0 


100,0 


Männer 


66,0 


34,0 


100,0 


Summe 


42,7 


57,3 


100,0 



Dann ist 

d = I 90-94 I = I 10-6 1=4 für Nachrichten 
d = 131-66 1 = 169-34 1 = 35 für Sport 

Um diese Zahlen zu interpretieren, muss man berücksichtigen, wie 
groß d minimal und maximal sein kann: 

d = 0 (Minimum): keine Anteilsdifferenzen, d.h. Männer und 
Frauen unterscheiden sich nicht 

d = 100 (Maximum): Kompletter Unterschied, z.B. alle Männer 
„ja“ und alle Frauen „nein“. 

Auf Grund dieser Eingrenzung kann man schließen, dass Nach- 
richtensendungen nur sehr schwach eine Geschlechterdifferenzie- 
rung bewirken, aber Sportsendungen mehr von Männern gesehen 
werden. Aber wie viel mehr? Diese Schwierigkeit der Bewertung 
der relativen Stärke der erhaltenen Maßzahl besteht hier ebenso 
wie schon bei der Kovarianz und ist ein generelles Problem aller 
Zusammenhangsmaße. Ist ein d von 4 überhaupt schon ein gesi- 
cherter Zusammenhang oder eher reiner Zufall bei nur 150 Befrag- 
ten? Ein d von 34 bedeutet, dass die sich die prozentualen Anteile 
von Frauen und Männern um 34 % unterscheiden; ist das nun 
schon ein „starker“ Zusammenhang? Beide Fragen erfordern zu- 
sätzliche statistische Vorbereitungen und können erst in Kap. 10 
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fortgeführt werden; dort werden auch weitere Maße für den Zu- 
sammenhang zweier kategorialer Variablen definiert. 



Weitere Literatur zu diesem Kapitel: Clauß u.a.: 46 - 62, Hoch- 
städter: 71-86, Kühnel/Krebs: 50-56, 83-103 

Übungsaufgaben: 

1. Nehmen Sie die Daten aus Aufgabe 1. in Kapitel 4. Berechnen 
Sie den Quartilsabstand dieser Daten und interpretieren Sie seinen 
Wert inhaltlich. 

2. Gegeben seien folgende Antworten auf einer Skala mit 7 Käst- 
chen zum Ankreuzen (Codes 1 bis 7): 

5,7, 3,4, 2, 1,6,4, 7, 5, 1,2,6, 3,2,7 

Transformieren Sie die Daten so, dass sie einen Mittelwert von 8 = 
0 und eine Standardabweichung von s = 1 haben. 




Kapitel 7: Die Normalverteilung und andere theore- 
tische Verteilungen 



Nachdem in den letzten Abschnitten die Beschreibung empirisch 
erhobener Datensätze behandelt wurde, werden die nächsten bei- 
den Abschnitte statistische Theorie behandeln. Diese Theorie ist 
aus folgenden Gründen notwendig: 

1. Zur Bestimmung der Möglichkeit und Genauigkeit induktiver 
Schlüsse (Inferenzstatistik): 

Sehr oft können nicht alle Personen befragt oder alle Objekte 
untersucht werden, über die auch eine Aussage gemacht wer- 
den soll, sondern nur eine kleine Zahl. Dann besteht das Prob- 
lem eines induktiven Schlusses von einer kleinen Auswahl auf 
die Gesamtheit. Um diesen Schluss wissenschaftlich und 
nachvollziehbar zu gestalten, müssen die allgemeinen Grund- 
lagen der Möglichkeiten eines solchen Schlusses theoretisch 
ermittelt werden 

2. Um theoretische, statistische Modelle uni- und multivariater 
Verteilungen mit empirisch Vorgefundenen Verteilungen ver- 
gleichen und damit Rückschlüsse auf die Gültigkeit der Mo- 
delle vornehmen zu können: 

Das Erscheinungsbild der Daten, ihre Häufigkeitsverteilung, 
wird durch bestimmte real bestehende Abhängigkeiten er- 
zeugt, d.h. es gibt Ursachen dafür, warum Daten so verteilt 
sind und nicht anders. Aus speziellen Zusammenhängen von 
Ursachen und Wirkungen kann andererseits theoretisch abge- 
leitet werden, welche Häufigkeitsverteilung von Daten da- 
durch erzeugt würden. Weiß man, welche Ursachenkomplexe 
bestimmten Häufigkeitsverteilungen zuzuordnen sind, kann 
man empirische Häufigkeitsverteilungen mit den theoretisch 
erzeugten Verteilungen vergleichen und so im Umkehrschluss 
auf die vorliegenden Ursachenkonstellationen schließen. 

V. Müller-Benedict, Grundkurs Statistik in den Sozialwissenschaften, 

DOI 10.1 007/978-3-53 1-93225-5_7, © VS Verlag für Sozialwissenschaften | 
Springer Fachmedien Wiesbaden GmbH 2011 
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Als Beispiel für das erste Problem sei die erste größere erfolgrei- 
che Wahlprognose der amerikanischen Präsidentschaftswahlen im 
Jahr 1936 genannt, die vom Gallup Institute in Konkurrenz zum 
Literary Digest durchgeführt wurde: 

„Die Zeitschrift , Literary Digest 1 hatte schon mehrfach bei 
amerikanischen Präsidentschaftswahlen so genannte ,polls‘ 
(Wahlumfragen) in großem Stil durchgeführt. Bei den Wah- 
len 1936 wurden zehn Millionen Probestimmzettel an Ame- 
rikaner verschickt, deren Adressen im Verzeichnis „Telefon 
und Auto“ eingetragen waren. Immerhin kamen 2,4 Millio- 
nen ausgefüllte Stimmzettel zurück, deren Auswertung ein 
klares Ergebnis zugunsten des Kandidaten Landon versus 
Roosevelt erbrachte. Ein damals noch unbekannter Forscher 
namens George Gallup wählte dagegen eine andere Metho- 
de: Er bildete eine relativ kleine Stichprobe, die in wesentli- 
chen Merkmalen einem verkleinerten Abbild der amerikani- 
schen Wählerschaft entsprach. Immerhin erzielte Gallup 
damals einen überwältigenden Erfolg. Seine Prognose laute- 
te, dass Roosevelt 1936 als Präsident wieder gewählt wurde. 
Der „Literary Digest“ unterschätzte dagegen die Stimmen- 
zahl Roosevelts um 19%. “ (Diekmann 1995:325-326) 

Der Grund lag darin, dass der Literary Digest die Adressen seiner 
Befragten über Telefonbücher oder Listen von Autobesitzern er- 
mittelte. Dabei wurden offenbar erheblich mehr gut situierte Bür- 
ger erwischt, die sich Telefon oder Auto überhaupt leisten konn- 
ten. Diese Schichten entwickelten in diesem Wahljahr offenbar 
gerade keine besondere Präferenz für den Kandidaten Roosevelt. 

Das Beispiel lehrt, dass nicht einfach die Masse von Beobach- 
tungen immer bessere Ergebnisse beschert, sondern dass man mit 
Hilfe statistischer Theorie schon mit verhältnismäßig sehr kleinen 
Datensätzen zu recht brauchbaren Verallgemeinerungen kommen 
kann. Aus theoretisch-statistischen Überlegungen lassen sich ge- 
nau die Bedingungen ableiten, die einen solchen Induktionsschluss 
ermöglichen. 

Als Beispiel für das zweite Problem sei eine Untersuchung 
eines Vorreiters zur Anwendung statistischer Verfahren auf gesell- 
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schaftliche Probleme, des Franzosen Adolphe Quetelet aus dem 
letzten Jahrhundert, genannt. Er erforschte u. A. die Verteilung der 
Körpergrößen von Menschen und benutzte dazu die Angaben der 
französischen Armee über die Größe von 100000 gemusterten 
Rekruten. Das ergab eine schöne stetige Häufigkeitsverteilung 
zwischen 1,30 und 1,90 m Größe, aber sie wies eine merkwürdige 
Lücke bei der Größe 1,54 m auf: es gab nämlich nur erstaunlich 
wenig Rekruten mit einer Größe knapp über 1,54 m (s. Abb. 7.1). 
Um die Frage zu entscheiden, ob diese Ursache natürlicher Art 
war, musste man wissen, welche theoretische Kurve die Vertei- 
lungsform von Körpergrößen beschreibt. Quetelet, der das wusste, 
konnte einwandfrei schließen, dass es sich hier um eine spezifische 
Musterungs-Lücke handelte, die sich daraus ergab, dass Männer 
unter 1 ,54 m Größe vom Militärdienst freigestellt wurden. 




Abbildung 7.1: Quetelets Ermittlung der Größe von Rekruten 



7.1 Die Normalverteilung als theoretische Verteilung 

Um das zweite Problem behandeln zu können, müssen die Vertei- 
lungsformen von Merkmalen, im Beispiel von Quetelets Untersu- 
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chung die von Körpergrößen, als theoretische Formel bzw. Modell 
bekannt sein. Das für die Körpergrößen zutreffende Modell trifft 
auch auf sehr viele andere natürliche, soziale und technische 
Merkmale zu: es ist die Gaußsche Normalverteilung. Sie ist in 
Abb. 7.1 als durchgezogene Linie eingezeichnet. Normalverteilt 
sind z.B. 

die Fehler, die Maschinen bei der Flerstellung eines normier- 
ten Teils in Bezug auf die Einhaltung der Norm machen 
viele biologische Variable wie Körperlänge etc. 

Messfehler, die Messinstrumente (auch sozialwissenschaftli- 
che) bei der Ablesung von Größenangaben machen. 

Sie wurde von dem Göttinger Mathematiker Gauß entdeckt. Sie 
hat eine typische eingipflige symmetrische glockenartige Form. 
Weil die Normalverteilung die wichtigste statistische Verteilung 
ist, wird sie im Folgenden zuerst theoretisch beschrieben. 



Definition : Die Normalverteilung N(jl, c) ist die Funktion 

(x-iO 2 

N(p, g)(x) = — 7 = e 2 ° 2 
ov27i 



Sie hat 2 Parameter: Mittelwert p und Standardabweichung o 




Abbildung 7.2: Grafik und Funktion der Normalverteilung auf dem früheren 10-D- 
Mark-Schein 
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Die Formel brauchte man sich früher nicht zu merken, weil sie auf 
jedem 10-D-Mark-Schein stand, ebenso wie die Grafik (s. Abbil- 
dung 7.2). Mittelwerte und andere Parameter wie die Streuung von 
theoretischen Verteilungen werden oft mit griechischen Buchsta- 
ben bezeichnet, in der Formel (J. und o. Die Normal Verteilung ist 
durch genau diese zwei Parameter vollkommen beschrieben, ft. ist 
der Mittelwert und c die Standardabweichung der theoretischen 
Normalverteilung. Der Mittelwert befindet sich am höchsten Punkt 
dieser Verteilung. Wichtig ist noch, dass die Normalverteilung von 
-oo bis +co reicht. Die Faktoren vor der Exponentialfunktion e die- 
nen der Normierung, d.h. sie stellen sicher, dass die Fläche unter 
dieser stetigen Häufigkeitsverteilung genau 1 ist. 






Abbildung 7.3: Verschiedene Gestalten der Normalverteilung (nach Bortz: 93) 
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Jede Normal Verteilung ist durch die zwei Parameter Mittelwert (t 
und Standardabweichung o eindeutig gekennzeichnet. Man sieht 
in Abbildung 7.3, dass eine Veränderung von |t eine Verschiebung 
der Verteilung in Richtung der x-Achse bewirkt: wird |X größer, so 
wandert die Verteilung nach rechts, wird p kleiner, nach links. 
Wird die Standardabweichung a größer, so wird die Verteilungs- 
form insgesamt flacher, wird o kleiner, so wird sie schmaler. 
Durch diese Möglichkeiten ist eine der vielen möglichen Normal- 
verteilungen besonders ausgezeichnet, nämlich diejenige mit Mit- 
telwert 0 und Standardabweichung 1 . 



Definition-. Die Verteilung N(0,1) heißt Standardnormalver- 
teilung oder z-Funktion. Sei ein Merkmal X mit N((0., o) nor- 
malverteilt, so kann X durch die Transformation 

Xj — > Zj = (X, -|t) / C 

in die Standardnormalverteilung überführt werden. Diese Trans- 
formation heißt z-Transformation oder z-Standardisierung 



(Zur Transformation s.a. Kap. 5.5). Auf Grund seiner Daten nahm 
Quetelet an, dass das theoretische Modell der Körpergrößen der 
französischen Rekruten die Normal Verteilung N(162 cm; 8 cm) 
sei. Damit lautet die z-Standardisierung dieser Normalverteilung 

X; — ^ ( X; - 162)/ 8 

N( 162; 8) > N (0; 1) 

und z.B. für die Klassenmittelwerte 150 und 170 von zwei Mess- 
wertklassen der Abb. 7.1: 

150 — > (150 - 162)/8 = - 1,5 
160 -> (170 - 162)/8 = 1 

Entsprechend gibt es ebenfalls eine „Rücktransformation“ aus der 
Standardnormal Verteilung in eine beliebige Verteilung mit Mittel- 
wert (J. und Standardabweichung c. Dafür wird die Transformati- 
onsgleichung 
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z = (x - (I) / G nach x aufgelöst und ergibt dann 

x = z a + p. 

Im Beispiel N(162; 8) wäre das: 

z— > x = z • 8 + 162 

N(0; 1) > N(162; 8) 

z.B. 

0,5 0,5 ■ 8 + 162 = 166 



7.2 Flächen unter der Normal Verteilung 

Hat man eine Normalverteilungskurve als theoretisches Modell 
eines Merkmals bestimmt, kann man ableiten, in welchem Ausmaß 
die Verteilungswerte von empirischen Daten dieses Merkmals vom 
theoretischen Modell abweichen. 

Bisher wurden immer Häufigkeitsverteilungen von endlich 
vielen Fällen behandelt, so dass hier kurz für den Fall einer steti- 
gen theoretischen Verteilung die Bedeutung der relativen Häufig- 
keit noch einmal wiederholt wird. Für eine einzelne Messwertklas- 
se war der relative Anteil an der Häufigkeit definiert durch eine 
Zahl zwischen 0 und 1. Z.B. hat in Abb. 7.1 die Messwertklasse 
mit Werten um die 1,54 m den relativen Anteil 4200/100000 = 
0,042. Die relativen Häufigkeiten aller Messwertklassen zusam- 
men ergeben genau 1 . Man kann das auch so interpretieren: wenn 
alles in relativen Häufigkeiten angegeben ist, hat die Fläche unter 
der Verteilungskurve, die sich ja aus allen Messwertklassensäulen 
zusammensetzt, den Wert 1. Für eine theoretische Verteilung er- 
folgt die Bestimmung genauso: Die Fläche unter der theoretischen 
Verteilung ist ebenfalls genau 1. Der relative Anteil, den ein Be- 
reich von Ausprägungen unter einer theoretischen Verteilung hat, 
ist dann genau durch die Fläche unter der Verteilungskurve über 
dem Bereich der Ausprägungen gegeben (s. Abbildung 7.4). 
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Abbildung 7.4: Flächenstücke unter einer theoretischen Verteilung 



Definition: Dichtefunktion heißt eine stetige Häufigkeitsvertei- 
lungsfunktion f eines metrischen Merkmals oder einer theoreti- 
schen Verteilung. Sei F die kumulierte Verteilung. Es gilt: 
relativer Anteil der Fälle mit Wert x aus Bereich a <= x < b 
= Fläche unter der Dichtefunktion f(x) über dem Intervall [a,b) 
= F(b) - F(a) 



Für eine Normal Verteilung als Dichtefunktion lässt sich auf 
diese Weise der genaue Anteil der Fläche über einem gegebenen 
Intervall oder unterhalb eines bestimmten Werts bestimmen, wenn 
man ihre kumulierte Verteilung kennt. Umgekehrt lassen sich so 
zu einem vorgegebenen Flächenanteil Intervallgrenzen finden, 
innerhalb derer genau dieser Flächenanteil vorhanden ist. 

Für eine solche Bestimmung gibt es Tafeln, in denen die ku- 
mulierte Standardnormalverteilung tabelliert ist. In diesen Tabellen 
(s. Tab. 7.1) ist die Fläche, a genannt, unter der Standardnormal- 
verteilung angegeben, die von - °°, dem linken „Ende“ der Nor- 
malverteilung, bis zu einem Wert z a auf der x-Achse reicht. 



Definition: z a - Wert heißt der Wert der Standardnormalvertei- 
lung (= z-Funktion), bis zu dem a-100 % der Fläche unter der 
z-Funktion gehören: 

Fläche von [- 00 , z„] = FCz,*) = a . (s. Abb. 7.5) 
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Abbildung 7.5: Beziehung zwischen a und z a bei der z-Verteilung 



Tabelle 7.1: Ausschnitt aus einer Tabellierung der Standardnor- 
malverteilung (Kühnel/Krebs: 642) 



o.ooo -« 
0.005 - 2.576 

0.010 - 2.326 
0.015 - 2.170 

0.020 - 2.054 

0.025 - 1.960 

0.030 - 1.881 

0.035 - 1.812 
0.040 - 1.751 

0.045 - 1.695 



0.150 - 1.036 

0.155 - 1.015 
0.160 - 0.994 

0.165 - 0.974 

0.170 - 0.954 

0.175 - 0.935 

0.180 - 0.915 

0.185 - 0.896 
0.190 - 0.878 

0.195 - 0.860 



a *a 

0.200 - 0.842 
0.205 - 0.824 
0.210 - 0.806 
0.215 - 0.789 
0.220 - 0.772 

0.225 - 0.755 
0.230 - 0.739 
0.235 - 0.722 

0.240 - 0.706 

0.245 - 0.690 



0.350 - 0.385 
0.355 - 0.372 
0.360 - 0.358 
0.365 - 0.345 
0.370 - 0.332 
0.375 - 0.319 
0.380 - 0.305 
0.385 - 0.292 

0.390 - 0.279 
0.395 - 0.266 



a z a 

0.400 - 0.253 
0.405 - 0.240 
0.410 - 0.228 

0.415 - 0.215 

0.420 - 0.202 
0.425 - 0.189 
0.430 - 0.176 
0.435 - 0.164 
0.440 - 0.151 

0.445 - 0.138 



0.550 0.126 

0.555 0.138 

0.560 0.151 
0.565 0.164 

0.570 0.176 

0.575 0.189 
0.580 0.202 

0.585 0.215 

0.590 0.228 

0.595 0.240 



a z a 

0.600 0.253 

0.605 0.266 

0.610 0.279 

0.615 0.292 
0.620 0.305 
0.625 0.319 

0.630 0.332 

0.635 0.345 
0.640 0.358 

0.645 0.372 



0.750 0.674 

0.755 0.690 

0.760 0.706 

0.765 0.722 
0.770 0.739 

0.775 0.755 
0.780 0.772 

0.785 0.789 
0.790 0.806 
0.795 0.824 



0.800 0.842 

0.805 0.860 

0.810 0.878 
0.815 0.896 

0.820 0.915 

0.825 0.935 
0.830 0.954 

0.835 0.974 

0.840 0.994 

0.845 1.015 



0.950 1.645 

0.955 1.695 

0.960 1.751 

0.965 1.812 

0.970 1.881 

0.975 1.960 

0.980 2.054 

0.985 2.170 

0.990 2.326 

0.995 2.576 

1.00 ~ 



Man liest z.B. ab, dass 

20 % der Fläche beim Wert z = -0,842 erreicht sind, 
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am Wert z = -0,196 genau 0,025 = 2,5 % der Fläche erreicht 
sind (und umgekehrt wegen der Symmetrie dann bei 0,196 
genau 1 - 0,025 = 0,975 = 2,5% der Fläche erreicht sind), 
das Intervall, innerhalb dessen 12% der Fläche symmetrisch 
um den Mittelwert 0 liegen, die Grenzen -0,151 und +0,151 
hat (die sich für jeweils 44% = 50% - 6% und 56% = 50% + 
6% der Fläche ergeben). 

Mit der Schreibweise der Definition kann man z.B. die Tabellen- 
werte für a = 0,5, 0,025 und 0,975 so schreiben: 
z o.5 = 0; z o.o 25 = ■ 1 >96; zo.975 = 1 >96 



7.3 Die Normalverteilung als theoretisches Modell 

Mit diesen Vorbereitungen kann nun Quetelets Vermutung präzi- 
siert werden. Die gemessenen Werte (in Messklassen) bei der 
Musterung waren die folgenden: 



Größe (Messklasse) 





Häufigkeit 


Prozent 


Gültige 

Prozente 


Kumulierte 

Prozente 


Gültig kleiner gleich 150 




8,0 


8,0 


8,0 


152,00 




5,8 


5,8 


13,8 


154,00 


KB 


4,2 


4,2 


18,0 


156,00 




7,7 


7,7 


25,7 


158,00 


rmm 


9,3 


9,3 


35,0 


160,00 


9900 


9,9 


9,9 


44,9 


162,00 


10220 


10,2 


10,2 


55,1 


164,00 


9900 


9,9 


9,9 


65,0 


166,00 


9300 


9,3 


9,3 


74,3 


168,00 


7650 


7,7 


7,7 


82,0 


größer gleich 170 


18040 


18,0 


18,0 


100,0 


Gesamt 


100000 


100,0 


100,0 





Also waren danach 18,0 % der Rekruten zu klein, um den Militär- 
dienst antreten zu können, nämlich kleiner als 154 cm. Quetelet 
hatte aber theoretisch bestimmt, dass die Körpergrößen der Rekru- 
ten nach dem Modell N(162 cm; 8 cm) verteilt sein müssten. Wie 
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viel Prozent der Rekruten hätten nun nach dem Modell kleiner als 
154 cm sein müssen? 

Wenn die Körpergrößen standardnormalverteilt wären, könnte 
man die entsprechenden Anteile aus einer Tabelle der Standard- 
normalverteilung (s. Tab. 7.1) ablesen. Das Modell N(162; 8) muss 
deshalb in die Standardnormalverteilung transformiert werden, 
damit man den entsprechenden Wert erhält. Das geschieht mit der 
z-Transformation: 



Xi — > Zj = ( Xi - 162)/ 8 

N( 162; 8) > N (0; 1 ) 

Dabei wird der Wert 154 cm transformiert in: 

154 — » (154 - 162)/8 = -1 = z a 

Der Anteil der Männer im Rekrutenalter mit Körpergrößen, die 
nach dem theoretischen Modell kleiner als 154 cm sind, ist nach 
dieser Transformation gleich dem Anteil der Fläche der Standard- 
normalverteilung bis zu dem Wert z a = -1. Den kann man in der 
Tabelle 7.1 ablesen: 

z„ = -1 => a = 0,1585 (interpoliert zwischen 0,155 und 0,160) 

d.h. theoretisch hätten nur 15,85% der Rekruten kleiner als 154 
cm sein dürfen. Damit konnte Quetelet nachweisen, dass sich 2,15 
% der Gemusterten mit Erfolg „kleiner gemacht“ haben, um dem 
Militärdienst zu entgehen. 



7.4 Die Normalverteilung als Stichproben- bzw. Prüfverteilung 

Die Normal Verteilung spielt eine zweite, wichtigere Rolle bei der 
Lösung des ersten am Anfang des Kapitels geschilderten Problems 
des Schlusses von einer Stichprobe auf die Gesamtheit. Dazu soll 
ein Beispiel aus den Jugendsurvey-Daten herangezogen werden. 
Dort wurden Jungen und Mädchen befragt, für wie wichtig sie 
Rücksichtnahme auf andere Personen halten. Dabei stellte sich 
heraus, dass sich Jungen und Mädchen in ihrem Urteil unterschei- 
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den. Die Jugendlichen konnten auf einer Skala mit 7 Unterteilun- 
gen von „ganz unwichtig“ (Wert 1) bis zu „sehr wichtig“ (Wert 7) 
ihre Antwort darauf ankreuzen, für wie wichtig sie Rücksichtnah- 
me auf andere Menschen halten. Die Mittelwerte und Standardab- 
weichungen der Antworten für Jungen und Mädchen waren: 



Tabelle 7.2: „Wichtigkeit von Rücksicht nehmen“ für Mädchen 
und Jungen 



Deskriptive Statistik 



Geschlecht 


N 


Mittelwert 


Standardab 

weichung 


maennlich wichtig: 

Ruecksicht nehm. 


1079 


5,23 


1,39 


weiblich wichtig: 

Ruecksicht nehm. 


1018 


5,52 


1,25 



Wie man sieht, haben die Mädchen einen höheren Mittelwert, 
halten Rücksichtnahme also für wichtiger. Es stellt sich nun sofort 
die Frage, inwiefern dieses Ergebnis verallgemeinert werden kann, 
z.B. auf alle in Deutschland lebenden Jugendlichen, und nicht etwa 
ein Ergebnis ist, dass sich aus der zufälligen Auswahl gerade die- 
ser 2096 Jugendlichen ergibt. 

Dazu einige Überlegungen: Wären die Befragten nach einem 
bestimmten Merkmal ausgewählt, z.B. nur Schüler befragt worden, 
wäre es sicherlich nicht möglich, die Ergebnisse auch auf Lehrlin- 
ge und berufstätige Jugendliche auszudehnen. Wären sie nur aus 
einer bestimmten Stadt ausgewählt, wäre es ebenso unmöglich, die 
Ergebnisse auf andere Regionen zu übertragen. Man nennt die 
Auswahl eine Stichprobe und die Menge, auf die mit Hilfe der 
Stichprobe geschlossen werden soll, die Grundgesamtheit. Die 
Überlegungen zeigen, dass eine Stichprobe im Prinzip ein verklei- 
nertes Abbild der Grundgesamtheit sein muss. Die einzige Mög- 
lichkeit, um auszuschließen, dass ein bestimmtes Merkmal in der 
Stichprobe in größerer Zahl vorhanden sein kann als in der Grund- 
gesamtheit, besteht darin, die Auswahl der Stichprobenelemente 
rein zufällig vorzunehmen. Denn nur damit werden alle mögli- 
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chen, auch bisher unbekannten Merkmale, in gleicher Weise er- 
fasst. Das führt zu folgender Definition: 



Definition'. Eine Grundgesamtheit (auch Population) besteht 
aus all denjenigen Objekten (Elementen, Untersuchungseinhei- 
ten, Merkmalsträgern), über die man eine Aussage treffen will. 
Eine Stichprobe aus einer Grundgesamtheit (auch Populati- 
on) von Elementen ist eine zufällige Auswahl von Elementen, 
bei der jedes Element dieselbe Chance hat, ausgewählt zu wer- 
den. 



Beispiel: Grundgesamtheit sei die Göttinger Bevölkerung. Eine 
Stichprobe ist dann eine zufällige Ziehung aus dem Register des 
Einwohnermeldeamts. Mit welchen Methoden im Einzelnen eine 
Annäherung an eine solche Zufalls-Auswahl bei tatsächlichen 
Umfragen erreicht werden kann, wird in der empirischen Sozial- 
forschung behandelt. 

Der Jugendsurvey und alle guten Befragungen wenden genau 
dieses Prinzip der Zufälligkeit bei der Stichprobenziehung an, so 
dass man mit diesen Datensätzen prinzipiell auf alle in Deutsch- 
land Lebenden zurück schließen kann. Die Frage, die sich dann 
stellt, ist also genauer, inwieweit der Mittelwert eines bestimmten 
Merkmals, der sich bei einer solchen Stichprobe ergibt, eine ge- 
naue Angabe für die Grundgesamtheit ist. 

Was kann geschehen, wenn man eine andere Stichprobe von 
nur 2100 Menschen aus der gewaltigen Grundgesamtheit von ca. 
20 Millionen deutschen Jugendlichen ebenso mit zufälliger Aus- 
wahl zieht? Kann sich nicht ein völlig anderer Wert auf Grund der 
zufälligen Auswahl ergeben (der Literary Digest hatte immerhin 
2,4 Mill. Menschen befragt)? Um dieser Frage näher zu kommen, 
kann man eine größere Anzahl zufälliger Stichproben ziehen und 
die Ergebnisse daraus vergleichen. 

Es wird also das folgende Experiment veranstaltet: Man zieht 
aus einer Grundgesamtheit 90 verschiedene Stichproben derselben 
Größe und berechnet jeweils die Mittelwerte von allen diesen 90 
Stichproben. Diese 90 Werte bilden die Rohdaten, von denen dann 
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die Häufigkeitsverteilung dargestellt wird. Es handelt sich damit 
also um eine Verteilung von Mittelwerten, d.h. um eine Verteilung 
von einem Verteilungsparameter. 

Die Grundgesamtheit bilden die im Jugendsurvey befragten 
2096 Jugendlichen, von denen der genaue Mittelwert bekannt ist 
(Tabelle 7.2). Dann werden 90 Mal jeweils 100 Befragte aus dieser 
Grundgesamtheit zufällig ausgewählt, also jeweils ca. 50 Jungen 
und ca. 50 Mädchen. Damit hat man nunmehr 90 verschiedene 
Stichproben für Jungen und für Mädchen. Von diesen 90 Stichpro- 
ben werden dann jeweils die Mittelwerte berechnet. Es ergeben 
sich folgende Bilder der Häufigkeitsverteilung dieser Mittelwerte 
(Abbildung 7.6): 



Jungen Mädchen 




Abbildung 7.6: Verteilung von Mittelwerten von 90 Stichproben, für Jungen (Stan- 
dardabweichung = 0,18) und Mädchen (Standardabweichung = 0,21) 



Die Bilder zeigen die Verteilungen der Mittelwerte von 90 ver- 
schiedenen, zufälligen Stichproben. Hier wurden gerade 90 ver- 
schiedene Stichproben gezogen. Man kann sich jedoch vorstellen, 
dass man sehr viel mehr, ja unendlich viele Stichproben aus einer 
Grundgesamtheit zieht und jeweils den Mittelwert bildet. Dann 
erhält man immer feinere Messwertklassen und eine immer glatte- 
re Häufigkeitsverteilungskurve. Wenn das Endresultat einer sol- 
chen immer weitergehenden Verfeinerung theoretisch bekannt 
wäre, dann wüsste man genau, wie sich die Mittelwerte aller nur 
denkbaren Stichproben um den wahren Mittelwert der Grundge- 
samtheit verteilen. Eine solche theoretische Verteilungsfunktion 
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wäre eine stetige Verteilungsfunktion, da der Mittelwert ein metri- 
sches Merkmal ist. 



Definition'. Bei der Häufigkeitsverteilung eines Parameters 
(Stichprobenverteilung) bestehen die Fälle aus Stichproben, 
und das Merkmal ist der jeweilige Parameter der Stichprobe. 
Eine theoretische Verteilung oder Prüfverteilung ist diejenige 
Stichprobenverteilung, die sich bei unendlich vielen Stichpro- 
ben ergeben würde. 



Die Leistung der Statistik besteht nun darin, dass sie diese theore- 
tischen Verteilungen für eine ganze Reihe von Parametern mathe- 
matisch herleiten kann. 

Wenn man einen bestimmten Parameter, z.B. den Mittelwert, 
einer einzigen Stichprobe berechnet, kennt man dann im Vorhinein 
die Häufigkeitsverteilung dieses Parameters. Damit kann der Pa- 
rameter einer einzigen Stichprobe mit der Verteilung aller mögli- 
chen Stichproben verglichen werden und daraus eine Abschätzung 
der Güte der Stichprobe abgeleitet werden. Die Güte einer Stich- 
probe kann also durch den Vergleich ihres Parameters mit der 
theoretischen Verteilung dieses Parameters ermittelt werden. In 
Abbildung 7.7 kann man z.B. sehen, wie die Mittelwerte der 90 
gezogenen Stichproben um die theoretische Verteilung streuen. 




V2 



Abbildung 7.7: Häufigkeitsverteilung und theoretische Verteilung eines Parameters 
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Die Normalverteilung ist deswegen so wichtig, weil ein star- 
kes theoretisches Ergebnis, der sog. zentrale Grenzwertsatz, die 
theoretische Verteilung von Stichprobenmittelwerten mit der Nor- 
malverteilung in Verbindung bringt: 



„Zentraler Grenzwertsatz“: 

Die Mittelwerte X aller Stichproben mit n Fällen aus einer 
Grundgesamtheit mit Mittelwert p und Standardabweichung a 
sind normalverteilt mit N(p, gN n). 

X - N(|i, c/Vn). 



Das Zeichen „ ~ “ bedeutet „verteilt nach der Funktion“. Damit hat 
der Satz die Streuung der Daten in der Grundgesamtheit mit der 
Streuung der Mittelwerte aus verschiedenen Stichproben, die aus 
dieser Grundgesamtheit gezogen werden, in Verbindung gebracht. 

Die Größe gN n hat einen speziellen Namen: sie heißt „Stan- 
dardfehler“. 



Definition : Standardfehler heißt die Standardabweichung der 
Mittelwerte- Verteilung, die Größe gN n. 



An den Daten aus der Jugendsurvey-Umfrage kann die Beziehung 
zwischen theoretischem Standardfehler und tatsächlicher Stan- 
dardabweichung der Mittel werte- Verteilung nachgerechnet wer- 
den. Die Standardabweichung der Grundgesamtheit ist für die 
Jungen 1,39 (Tabelle 7.2). Das n, die Größe der gezogenen Stich- 
proben, ist n = 100 für Mädchen und Jungen, d.h. für ein Ge- 
schlecht alleine 50. \ : 50 ist gleich 7,07. Dann ist der Standardfeh- 
ler 1,39/7,07 = 0,197. Die Prüfverteilung der Mittelwerte aller 
möglichen Stichproben der Größe 50 aus den Fällen des Jugend- 
surveys ist deshalb die Verteilung N(5,23; 0,197), mit dem Mit- 
telwert 5,23 aus der Grundgesamtheit und dem berechneten Stan- 
dardfehler 0,197 als Standardabweichung. Die tatsächliche Stan- 
dardabweichung, die die Auswahl von 90 gezogenen Stichproben 
für die Jungen ergibt, ist 0,18 (s. Abbildung 7.6). Sie weicht - 
durch den Zufall der Auswahl der 90 Stichproben bedingt - ein 
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wenig von der theoretisch abgeleiteten Prüfverteilung ab, ist aber 
genau um die Größenordnung des Faktors \n kleiner. Damit ist die 
in diesem Satz belegte Beziehung zwischen der Standardabwei- 
chung der Grundgesamtheit und der Standardabweichung der Mit- 
telwerte aller möglichen Stichproben, dem Standardfehler, in die- 
sem Beispiel wieder auffindbar. 

Die Frage, wie weit denn eigentlich ein Mittelwert einer 
Stichprobe vom tatsächlichen Mittelwert der Population abwei- 
chen kann, kommt mit diesen Vorbereitungen einer Antwort näher. 
Die Kenntnis der Prüfverteilung ermöglicht es nun nämlich einzu- 
grenzen, wie groß die Anteile von Stichproben sind, deren Mittel- 
werte mindestens einen vorgegebenen Abstand vom tatsächlichen 
Populationsmittelwert abweichen. Weil die Prüfverteilung der 
Mittelwerte nach dem Zentralen Grenzwertsatz eine Normalvertei- 
lung ist, können solche Anteile auf die in den vorangehenden Ka- 
piteln beschrieben Weise ermittelt werden. 

Diese Ermittelung sei zunächst wieder theoretisch an der 
Standardnormalverteilung erläutert. Gegeben sei ein Anteil a von 
z-Werten, die maximal weit weg vom Mittelwert liegen. Um das 
zu erreichen, muss dieser Anteil geteilt und beide Hälften an das 
linke und rechte Ende der Verteilung gestellt werden. 




Abbildung 7.8: Anteil a von z-Werten mit maximaler Entfernung vom Mittelwert 0 



Ein Intervall zwischen a und b wird [a; b] geschrieben. Das kon- 
struierte Intervall um den Mittelwert 0, außerhalb dessen genau 
a-100% der Fläche liegen und das symmetrisch um den Mittelwert 
liegt, kann man mit der Notation aus Kap. 7.2 schreiben als 
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[Zaj 2 ; Zi-a/ 2 ] = Intervall um den Mittelwert 0 mit oc-100 % der Flä- 
che außerhalb (s. Abbildung 7.8). Wegen Symmetrie gilt weiter: 
Zl-a/2 = - Zo/2- 



In Abbildung 7.9 kann man z.B. für die ±z aj 2 -Werte ±1,2 oder 3 
G ablesen, wie groß der jeweilige Anteil der Fläche innerhalb die- 
ser Grenzen ist. Wenn nun als Verteilung hier eine Prüfverteilung 
vorliegt, bedeutet das, dass z.B. 68,27% aller Stichproben Mittel- 
werte ergeben, die nicht mehr als nur einen Standardfehler vom 
wahren Mittelwert abweichen. 




99,73% 



Abbildung 7.9: Normal Verteilung mit Flächenangaben der +-1,2 oder 3a- Berei- 
che 



Für einen bestimmten Anteil von z.B. 5% können auf diese Weise 
genau die Grenzen angegeben werden, die die 5% oder 10% am 
weitesten vom Mittelwert entfernten z-Werte überschreiten: 

a = 5% = 0,05; a/2 = 0,025, 1- a/2 = 0,975; 

Die Tabelle ergibt: z (ll 2 = -1,96, Zi.a/ 2 =1,96. 
a = 10% = 0,1; a/2 = 0,05, 1- a/2 = 0,95; 

Die Tabelle ergibt: z 0 j 2 = -1,645, Z|. =1.645. 

D.h. im Intervall [- 1,96; 1,96] liegen 95% aller symmetrisch um 
den Mittelwert verteilten z-Werte. Wenn die Verteilung eine Prüf- 
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Verteilung wäre, würde das wiederum heißen, dass 95% aller 
Stichprobenmittelwerte zwischen diesen Grenzen liegen. Die 
Chance, dass der Mittelwert einer beliebigen Stichprobe zwischen 
diesen Grenzen liegen wird, ist damit 19 zu 1. Man kann also mit 
dem Wissen um die theoretische Verteilung genau angeben, wie 
groß die Chancen einer beliebigen Stichprobe dafür sind, dass sie 
einen Mittelwert ergibt, der innerhalb bestimmter Grenzen um den 
tatsächlichen Mittelwert der Population liegt. 

Die Intervallgrenzen beziehen sich bisher nur auf die Stan- 
dardnormalverteilung. Wie berechnet man diese Bereiche für be- 
liebige Prüfverteilungen? Man weiß zwar jetzt, dass 95% aller 
standardisierten Stichprobenmittelwerte innerhalb des Intervalls 
[-1,96; 1,96] liegen, aber in welchem Intervall liegen z.B. die 
Stichprobenmittelwerte der obigen Variablen des Jugendsurveys? 

Oben wurde ermittelt, dass die Prüfverteilung der aus dem 
Jugendsurvey gezogenen Stichproben für die Jungen die Normal- 
verteilung mit den Parametern N(5,23; 0,197) ist. Nun wird die 
Rücktransformation von Intervallen der Standardnormalverteilung 
in Intervalle beliebiger Normalverteilungen gebraucht. Die Formel 
für die Rück-Transformation lautete x — > x • o + p. Für die Rück- 
transformation des Intervalls [-1,96; 1,96] in die Normal Verteilung 
N(5,23; 0,197) werden beide Intervallgrenzen gemäß der Formel 
transformiert: 

[ -1,96-0,197 + 5,23; 1,96-0,197 + 5,23] = 

[ -0,38 + 5,23 ; 0,38 + 5,23] = [4,85; 5,64], 

Damit kann Folgendes angegeben werden: Wenn man Stichproben 
der Größe 50 aus einer Grundgesamtheit zieht, in der der Mittel- 
wert 5,23 und die Standardabweichung 1,39 (und damit der Stan- 
dardfehler 1,39/^50 = 0,197) betragen, dann werden 95% der Mit- 
telwerte aller nur möglichen Stichproben zwischen 4,85 und 5,64 
liegen. Die Rücktransformation kann man ebenfalls ganz allge- 
mein berechnen: 

über [-1,645; 1,645] liegen 90% der Fläche unter N(0, 1) => über 
[-1,645-0 + p; 1,645-0 + p] liegen 90% der Fläche unter N(p, o) 
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über [-1,96; 1,96] liegen 95% der Fläche unter N(0, 1) => über 
[1,96 c + ( 0 .; 1,96 c + p] liegen 95% der Fläche unter N(p, c) 

Das Bisherige führt zu folgender Definition: 



Definition : Ein durch die theoretische Verteilung eines Parame- 
ters bestimmtes Intervall, innerhalb dessen (l-a)TOO % aller 
Stichprobenparameter symmetrisch um den theoretischen Pa- 
rameter liegen, heißt Schwankungsintervall zum Niveau a. 
a heißt das Fehler-Niveau, 1-a das Sicherheitsniveau. 



Für eine beliebige Prüfverteilung N(p, c) lässt sich ein solches 
Schwankungsintervall mit den eingeführten Bezeichnungen noch 
allgemeiner angeben: Das Schwankungsintervall zum Niveau a 
für N(p, o) ist [ Za/2 -o + p ; z UaJ2 -c + p ]. 

Das anfängliche Problem, auf welche Weise man aus dem 
Mittelwert einer Stichprobe auf die Grundgesamtheit zurück 
schließen kann, hat nun eine Antwort erhalten. Aber es ist noch 
nicht ganz die Antwort, die man benötigt. Man kann nun zwar 
genau angeben, wie groß die Chance ist, dass der Stichprobenmit- 
telwert in einen bestimmten Bereich um den wahren Mittelwert 
fällt, indem man das exakte Schwankungsintervall angibt. Im All- 
gemeinen weiß man ja aber gar nicht den tatsächlichen wahren 
Mittelwert der Grundgesamtheit, sondern will ihn erst schätzen. 
Wie man aus den bisherigen Angaben auch den unbekannten tat- 
sächlichen Mittelwert schätzen kann, ist Thema der beiden folgen- 
den Kapitel. Man kann aber jetzt schon ein wenig einschätzen, wie 
weit Mittelwerte von Stichproben überhaupt prinzipiell vom wah- 
ren Mittelwert abweichen können. 

Noch etwas ist erwähnenswert: die Angabe des Schwankungs- 
intervalls ist ganz unabhängig davon, wie groß die Grundgesamt- 
heit ist, d.h. vom N der Population! Sie ist allein abhängig von der 
Stichprobengröße und der Streuung in der Population, aber nicht 
von der Größe der Population. D.h. im konkreten Fall ist es nicht 
nötig, genau zu wissen, wie viele Personen es überhaupt genau 
sind, über die man eine Aussage macht. Wenn nur berücksichtigt 
wird, dass eine fachgerechte Stichprobe genommen wird, d.h. 
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jeder Person dieselbe Chance gegeben wird, ausgewählt zu wer- 
den, dann kann die Aussage aus der Stichprobe auf alle Personen 
der Grundgesamtheit verallgemeinert werden, ohne genau zu wis- 
sen, wie viele „Alle“ eigentlich sind. Diese Aussage ist allerdings 
genau genommen nur für große N korrekt, bei kleinen Grundge- 
samtheiten, bei denen die Stichprobengröße mehr als 10% der 
Population ausmacht, sollte eine sog. „Endlichkeitskorrektur“ 
angewendet werden (Lohr 1999:33). 

Das Vorgehen soll an einem Beispiel noch einmal durchge- 
führt werden, an einer Frage aus dem ALLBUS 94. Es lag eine 7- 
stufige Skala vor, auf der die Befragten die Größe ihres Vertrauens 
in öffentliche Einrichtungen ankreuzen sollten. Die Skala reichte 
von „gar kein Vertrauen“ (Wert 1) bis zu „sehr großes Vertrauen“ 
(Wert 7). Tabelle 7.3 zeigt die Ergebnisse für das Vertrauen in das 
öffentliche Gesundheitswesen (V124 im ALLBUS 94). 



Tabelle 7.3: Vertrauen in das Gesundheitswesen 



Statistiken 



VERTRAUEN: GESUNDHEITSWESEN 



N Gültig 


3443 


Fehlend 


7 


Mittelwert 


4,74 


Standardabweichung 


1,49 



VERTRAUEN: GESUNDHEITSWESEN 





Häufigkeit 


Prozent 


Gültige 

Prozente 


Kumulierte 

Prozente 


Gültig GAR KEIN VERTRAUE! 


99 


2,9 


2,9 


2,9 




167 


4,8 


4,9 


7,7 




419 


12,1 


12,2 


19,9 




728 


21,1 


21,1 


41,0 




869 


25,2 


25,2 


66,3 




756 


21,9 


22,0 


88,2 


GROSSES VERTRAUE 


405 


11,7 


11,8 


100,0 


Gesamt 


3443 


99,8 


100,0 




Fehlend KEINE ANGABE 


7 


,2 






Gesamt 


3450 


100,0 
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Bei dieser Befragung 1994 lag der Mittelwert der Skala, die 
von 1 bis 7 geht, bei 4,74, so dass man davon ausgehen kann, dass 
das Gesundheitswesen in der Bevölkerung mittleres Vertrauen 
genießt. Bei dieser Befragung wurden 3443 Menschen befragt. 
Wie genau ist nun eigentlich die Angabe des Mittelwerts, wenn 
man 3443 Leute befragt? Die Frage nach der Genauigkeit der 
Angabe des Mittelwerts kann man mit dem bisher entwickelten 
Instrumenten nun exakter so stellen: In welchem Bereich liegen 
95% aller Stichprobenmittelwerte bei Stichproben der Größe 
3443? 

Zur Berechnung sei angenommen, dass der Mittelwert von 
4,74 und die Standardabweichung von 1 ,49 aus dieser einen Stich- 
probe auch die wahren Werte in der gesamten Bevölkerung dar- 
stellen. Dann sind die Mittelwerte aus allen Stichproben - nach 
dem zentralen Grenzwertsatz - verteilt mit N(4,74; 1 ,49/a/ 3443) = 
N (4,74; 0,025). Damit ergibt sich das Intervall, in dem 95% aller 
Mittelwerte liegen, nach der obigen Formel zu: 



[zo.o 25 • et + p; (x + a • zo.975] 

= [- 1 ,96 • 0,025 + 4,74; 4,74 + 0,025 • 1 ,96] 

= [4,69:4,79]. 

Das bedeutet, dass bei Stichproben der Größe 3443 und einer 
Standardabweichung in der Grundgesamtheit von 1,49 bei 95% 
aller möglichen Stichproben der Mittelwert nur um höchstens ca. ± 
0,05 (bei einer Skala von 1 bis 7) vom wahren Wert abweicht. 
Diese überraschende Genauigkeit ist der Grund, weshalb die Mei- 
nungsforschung so erfolgreich sein kann: weil sie mit relativ klei- 
nen Stichproben, wenn sie exakt zufällig gezogen werden, genaue 
Angaben über beliebig große Grundgesamtheiten machen kann. 



7.5 Die % 2 - Verteilung 

Mit der Normalverteilung als Stichprobenverteilung des Mittel- 
werts ist eine besonders häufig vorkommende theoretische Vertei- 
lung beschrieben. Andere Verteilungsparameter haben andere 
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theoretische Stichprobenverteilungen, die ebenfalls oft benötigt 
werden. Das Verfahren, die Güte von Stichproben durch die Kon- 
struktion von Schwankungsintervallen abzuschätzen, ist identisch. 

Die x 2 - Verteilung („Chi-Quadrat“) ist die Verteilung, nach der 
die Varianzen von Stichproben verteilt sind. Warum kann hier die 
Normal Verteilung nicht die richtige theoretische Verteilung sein? 
Die Varianz ist immer größer 0 und kann bis plus unendlich gehen, 
deshalb kann keine Stichprobenverteilung der Varianz symmet- 
risch sein; das aber ist die Normalverteilung. Die % 2 - Verteilung 
hat nur einen Parameter, die sog. „Anzahl der Freiheitsgrade“ f. 

Die Varianzen s 2 einer Reihe von Stichproben mit n Fällen aus 
einer normal verteilten Grundgesamtheit mit Varianz er sind wie 
folgt verteilt: 



Definition'. Die % 2 - Verteilung ist (u.a.) die Verteilung der Va- 
rianzen von Stichproben. Die Varianzen s 2 von Stichproben 
vom Umfang n aus einer normalverteilten Grundgesamtheit mit 
Varianz er sind wie folgt verteilt: 

s 2 - (a 2 /(n-l) ) x 2 n -i 

Der Parameter n -l=f der % f -Verteilung heißt Freiheitsgrad f. 




Abbildung 7.10: Verschiedene Gestalten der % 2 -Verteilung (Bortz: 102) 
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Die yj - Verteilung hat für jedes f eine unterschiedliche Gestalt % 2 f 
genau wie die Normalverteilung für jedes (J. und o eine andere 
Gestalt hat (s. Abbildung 7.10). Der Mittelwert der % 2 f - Verteilung 
ist f, ihre Varianz ist gleich 2f. 

ln ähnlicher Weise, wie bei der Verteilung des Mittelwerts die 
Varianz in der Grundgesamtheit durch die Größe der Stichprobe n 
geteilt wurde, um die Streuung des Parameters Mittelwert zu be- 
rechnen, wird hier die Varianz der Grundgesamtheit durch den 
Faktor n-1, die Freiheitsgrade, geteilt. Dadurch wird auch hier die 
Streuung der Varianzen aus Stichproben um die wahre Varianz 
umso kleiner, je größer die Stichprobe, d.h. das n, wird. 

Mit Hilfe der y 2 - Verteilung kann man nun Schwankungsin- 
tervalle ausrechnen, in die bestimmte Prozentsätze von Stichpro- 
ben- Varianzen fallen. Da Varianzen immer positiv sind und des- 
halb ihre Schätzung in Richtung auf zu kleine Werte nach unten 
durch 0 begrenzt ist, ist es oft nur von Interesse, wie weit sie nach 
oben von der tatsächlichen Varianz der Grundgesamtheit ab wei- 
chen. Im Folgenden sei angenommen, dass Stichproben mit je- 
weils 10 Fällen vorliegen, und dass die Varianz der Grundgesamt- 
heit G 2 = 1 beträgt. Es soll nun ermittelt werden, wie groß der Wert 
an ermittelter Varianz ist, den nur noch 5 % aller Stichproben 
überschreiten: 

Frage: Die Grundgesamtheit habe Varianz <r = 1, die Stichpro- 
bengröße sei n = 10. Wie groß ist die Varianz s 2 , die 5% aller 
Stichproben überschreiten? 

Genauso wie beim Mittelwert zunächst die Werte der Standard- 
normalverteilung nachgesehen und diese Werte dann rücktrans- 
formiert werden mussten, muss hier zuerst der y 2 - Wert nachge- 
sehen und dann mit Hilfe der Definitionsformel rücktransformiert 
werden. Die y 2 - Funktion entnimmt man Tabellen. Ein Beispiel 
gibt Tabelle 7.4. Die Parameter, die man zum Ablesen benötigt, 
sind die Freiheitsgrade, hier f = n-1 = 9, und der a - Wert, hier 
0.05 = 5%. Da hier nur die Werte interessieren, die größer als der 
Grundgesamtheitswert sind, wird der Anteil a insgesamt am rech- 
ten Rand der Verteilung platziert d.h. man sucht in der Tabelle in 
der Spalte für 1 - a = 0,95 = 95%. 
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Tabelle 7.4: Ausschnitt aus der Tabelle der X -Verteilung 
(Clauß u.a.:388) 





a 


/ 












[3 


0,30 


0,10 


0,05 


0,025 


0,01 




1 


,000157 


,000982 


,00393 


,0158 


.148 


.455 


1,07 


2.71 


3,84 


5,02 


6,64 


10,8 


2 


.0201 


.0506 


,103 


.211 


.713 


1,39 


2,41 


4,61 


5,99 


7,38 


9,21 


13.8 


3 


,115 


.216 


,352 


.584 


1.42 


2,37 


3.67 


6,25 


7,81 


945 


114 


16,3 


4 


497 


.484 


.711 


1,06 


2,19 


3,36 


4,88 


7,78 


9.49 


11.1 


13,3 


18.5 


5 


,554 


.831 


1,15 


1.61 


3,00 


4,35 


6,06 


9,24 


li. i 


12,8 


15,1 


20,5 


6 


,872 


1.24 


1,64 


2,20 


3.83 


5,35 


7,23 


10,6 


12,6 


14,4 


16,8 


22,5 


7 


1.24 


1,69 


2,17 


2,83 


4,67 


6,35 


8,38 


12,0 


14.1 


16,0 


18.5 


24,3 


s 


1,65 


2,18 


2,73 


3,49 


5,53 


7,34 


9,52 


13.4 


15,5 


17,5 


20,1 


26,1 


9 


2,09 


2,70 


3,33 


4,17 


6,39 


8,34 


10.7 


14.7 


16,9 


19,0 


21,7 


27,9 


10 


2,56 


345 


3.94 


4,87 


7,27 


9,34 


11.8 


16,0 


18,3 


20,5 


23,2 


29.6 


11 


3.05 


3,82 


4,57 


5,58 


8,15 


10,3 


12.9 


17,3 


19,7 


21,9 


24,7 


314 


12 


3,57 


4,40 


5,23 


6,30 


9,03 


11.3 


14.0 


18.5 


21,0 


234 


26,2 


32,9 


13 


4,11 


5,01 


5,89 


7,04 


9,93 


12.3 


15,1 


19,8 


22.4 


24,7 


27,7 


34.5 


14 


4,66 


5,63 


6,57 


7,79 


10.8 


13.3 


164 


21.1 


23,7 


26.1 


29,1 


36,1 


15 


5,23 


646 


7,26 


8,55 


11.7 


14,3 


17.3 


224 


25,0 


274 


30,6 


37,7 


16 


5,81 


6,91 


7,96 


9,31 


12,6 


154 


18,4 


23,5 


26,3 


28,8 


32,0 


39,3 


17 


6,41 


7,56 


8.67 


10.1 


13,5 


16,3 


19,5 


24,8 


27,6 


304 


33,4 


40,8 



In der Tabelle ergibt sich so: % 2 9 : o,o 5 = 16,9. 

Der zweite Index am % 2 zeigt das a-Niveau, die verbleibende Flä- 
che, an. Dieser Wert muss nun nach der obigen Formel noch auf 
die tatsächliche Verteilung rücktransformiert werden: 



s 2 = (o 2 /(n-l)) • xVuo.os = (1/9) • 16,9 = 1,88. 



Das bedeutet, dass nur 5% aller Stichproben mit 10 Fällen eine 
Varianz von über 1,88 ergeben. 

Die % 2 - Verteilung ist auch deswegen wichtig, weil sie die 
Prüfverteilung von zwei anderen häufigen Problemstellungen ist: 
der Vergleich einer empirischen kategorialen Häufigkeitsver- 
teilung mit einer vorgegebenen Häufigkeitsverteilung 
die Frage, ob zwei kategoriale Merkmale Zusammenhängen 
oder nicht (s. Kap. 10). 
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7.6 Die Binomialverteilung 

Die dritte theoretische Verteilung, die für elementare sozialwissen- 
schaftliche Statistik wichtig ist, ist die Binomialverteilung. Sie ist 
diejenige theoretische Verteilung, nach der ein Kennwert eines 
kategorialen Merkmals verteilt ist, nämlich die relative Häufigkeit 
einer bestimmten Ausprägung dieses Merkmals, also der Anteil 
dieser Ausprägung. 

Als Beispiel für einen solchen Anteil soll der Anteil der Abitu- 
rientinnen in den ALLBUS-Daten bestimmt werden. In dem Da- 
tensatz mit 3443 Befragten gibt es genau 490 Befragte mit Abitur, 
d.h. einen Anteil von 490/3443 = 0,142 = 14,2%. Die Frage ist nun 
wieder: wenn man Stichproben, z.B. mit der Fallzahl 20, zieht und 
jeweils die Anzahl an Abiturientinnen in diesen kleinen Stichpro- 
ben bestimmt, wie weit streuen solche aus Stichproben ermittelten 
Werte um den wahren Wert in der Grundgesamtheit von 14,2% 
Abiturientinnen? 

Frage: Sei der wahre Anteil der Abiturientinnen = 14,2% = 0,142, 
und es gebe Stichproben der Größe n = 20. Welche Fallzahlen von 
Abiturientinnen in der Stichprobe kommen wie häufig vor? 

Die theoretische Verteilung, die diese Frage beantwortet, ist die 
Binomialverteilung. 



Definition: In einer Grundgesamtheit mit insgesamt N Elemen- 
ten gebe es K Elemente mit einer bestimmten Ausprägung, ihr 
Anteil ist 7t = K/N. Man zieht Stichproben vom Umfang n und 
bestimmt in ihnen jeweils die Anzahl k der Elemente mit der 
bestimmten Ausprägung. Dann ist 

k - B(n, 7t) binomialverteilt mit den Parametern n und 7t. 

Der Mittelwert der Binomialverteilung ist n7t, 
ihre Varianz = n 7t ( 1 - 7t). 



Genau genommen gilt die Binomialverteilung nur, wenn ein Fall 
aus der Grundgesamtheit auch durch den Zufall doppelt oder 
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mehrfach in der Stichprobe auftauchen kann (sog. „Ziehen mit 
Zurücklegen“). Wenn die Größe der Stichprobe viel kleiner als die 
der Grundgesamtheit ist, ist das jedoch nur sehr selten der Fall, 
und die Binomialverteilung ist eine sehr gute Approximation. 

Die Binomialverteilung ist eine kategoriale Verteilung, die nur 
die diskreten Werte 0, 1, 2, ..., n annehmen kann. Sie hat zwei 
Parameter, die Größe der Stichprobe n und den tatsächlichen An- 
teil 7t. Abbildung 7.11 zeigt einige verschiedene Binomialvertei- 
lungen: 








B x(-t) 



Abbildung 7.1 1: Verschiedene Gestalten der Binomialverteilung (Thome: 60) 



Für jeden Wert k zwischen 0 und n kann man ablesen, wie viel 
Prozent aller möglichen Stichproben der Größe n genau diese 
Anzahl k an den interessierenden Elementen mit der bestimmten 
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Ausprägung besitzen; es gibt keine dazwischen liegenden Angaben 
wie bei der metrischen Verteilung des Mittelwerts und der Vari- 
anz. Da die Anzahl der Ausprägungen endlich und die Anzahl der 
Fälle in der Stichprobe ebenfalls endlich ist, kann man alle mögli- 
chen Kombinationen von Ausprägungen, die überhaupt auftreten 
können, zählen und ihren Anteil berechnen; auf genau diese Weise 
kommt die Tabelle der Binomialverteilung auch zustande. 

Im Beispiel zieht man Stichproben von 20 Fällen. Die interes- 
sierenden Abiturientinnen können in diesen Stichproben die An- 
zahlen von 0 bis 20 haben. Damit kann der genaue Wert von 
14,2% sowieso nicht erreicht werden: 14,2% von 20 sind 2,84, 
man kann aber in jeder Stichprobe immer nur eine ganze Zahl von 
Abiturienten vorfinden. Es ist deshalb zu erwarten, dass in den 
Stichproben von 20 Fällen die Zahlen 2 und 3 Abiturientinnen am 
häufigsten Vorkommen werden. Mit Hilfe einer Tabelle der Bino- 
mialverteilung kann nun wieder genau bestimmt werden, wie viel 
% der Stichproben z.B. genau eine 2 oder eine 3 haben werden. 



Tabelle 7.5: Ausschnitt aus der Tabelle der Binomialverteilung 
(Clauß u.a.:430) 



k 


.080 


.090 




.150 




.250 


.300 




.500 


0 


.1887 


.1516 


.1216 


.0388 


.0115 


.0032 








1 


.3282 


m:o:m 


Eia 


.1368 




.0211 






.0000 


2 


.2711 


.2818 


.2852 


.2293 


.1369 


.0669 


.0278 




k>:o» 


3 


.1414 


1672 


.1901 


.2428 


.2054 


.1339 


.0716 




.0011 


4 


.0523 


.0703 


.0898 


.1821 


.2182 


.1897 


.1304 


.0350 


.0046 


5 


.0145 


.0222 


.0319 


.1028 


.1746 


.2023 


.1789 


EZ1 


.0148 


6 


.0032 


.0055 


.0089 




.1091 


.1686 


.1916 


.1244 


.0370 


7 


. 0005 - 


.0011 


.0020 




.0545 


.1124 


.1643 


.1659 


.0739 


8 


.0001 


.0002 


.0004 




.0222 


.0609 


.1144 


.1797 


.1201 


9 


.0000 


.0000 


0001 


.0011 




.0271 


.0654 


.1597 


mvxrm 




.0000 


.0000 


.0000 


.0002 






.0308 


.1171 


.1762 




.0000 


.0000 


.0000 






0030 


.0120 




.1602 


D 


.0000 


.0000 


0000 












.1201 


ggj 


0000 


.0000 


.0000 










.0146 


.0739 




.0000 


0000 


.0000 












.0370 




.0000 


.0000 


.0000 










.0013 


.0148 




.0000 


.0000 


.0000 
















.0000 


.0000 


.0000 












.0011 




.0000 


.0000 


.0000 
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In dieser Tabelle sind die Werte von p = n, dem wahren Anteil, nur 
in größeren Sprüngen vorhanden. Um genauer zu werden, müsste 
interpoliert werden. Um das Verfahren abzukürzen, soll hier statt 
des genauen Werts von 0,142 der Wert p = 0,15 genommen wer- 
den. Die Tabelle zeigt, dass dann Stichproben mit 2 Abiturientin- 
nen einen Anteil von 0,2293 = 22,93%, solche mit 3 einen Anteil 
von 0,2428 = 24,28%, solche mit 4 einen Anteil von 0,1821 = 
18,21%, solche mit 5 immerhin noch einen Anteil von 10% und 
solche mit gar keinem Abiturienten oder Abiturientin immerhin 
noch fast 4% Anteil haben. 

Mit Stichproben im Umfang von 20 Fällen kann man offenbar 
nur Anteilswerte von k/20, z.B. 2/20 = 0,1 oder 3/20 = 0,15 genau 
schätzen. Im Fall der Binomialverteilung kann der gesuchte An- 
teilswert generell nur so genau geschätzt werden, wie es die Fall- 
zahl der Stichprobe erlaubt. 

Aus den Angaben der Tabelle folgt, dass Stichproben der 
Größe 20, die 2 bis 4 Fälle enthalten, genau 22,93 + 24,28 + 18,21 
= 65,42% aller Stichproben sein werden. D.h. mindestens ein Drit- 
tel aller Stichproben ergibt nur 1 oder weniger bzw. 5 oder mehr 
Abiturienten, also Anteile, die von dem tatsächlichen Anteil in der 
Grundgesamtheit weit abweichen. Also ist die Antwort auf die 
obige Frage: 65,42% aller Stichproben der Größe 20 enthalten bei 
einem wahren Anteil der Ausprägung von 14,2% in der Grundge- 
samtheit Fälle von 2, 3 und 4 Personen mit dieser Ausprägung. 

Alle wichtigen Ergebnisse dieses Kapitels sind in der folgen- 
den Tabelle 7.6 zusammengefasst. Die Parameter der Stichproben 
sind durch kleine lateinische Buchstaben gekennzeichnet, im Un- 
terschied zu den griechischen Buchstaben für die theoretischen 
Verteilungen. 
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Tabelle 7.6: Theoretische und Stichproben-Verteilung von 3 wich- 
tigen Parametern 



Parameter 
einer Stich- 
probe mit n 
Fällen 


theoretische 
Verteilung 
des Parame- 
ters 


Parameter 
der theoreti- 
schen Vertei- 
lung 


Stichproben- 
verteilung des 
Parameters 


Mittelwerte X 


Normalver- 

teilung 


Mittelw. |_i 

Standardabw. 

c 


X ~ 

N(p, g/V n) 


Varianzen s 2 


Verteilungf 


Freiheitsgrad 
f = n-1 




Häufigkeiten k 
einer Ausprä- 
gung 


Binomialver- 

teilung 


Fallzahl n 
Anteil K 


k ~ 

B(n, n) 



7.7. Die Übergänge in die Normalverteilung von yj und B(n, p) 

Wenn man sich die Kurven sowohl der % 2 -Verteilung als auch 
einiger Binomialverteilungen ansieht (Abb. 7.10, 7.11), kann man 
bemerken, dass sie mit zunehmend größer werdenden Parametern 
einer Normal Verteilung immer ähnlicher werden. 

Das ist tatsächlich der Fall, wie sich mathematisch ableiten 
lässt. Dieses Resultat ist ein weiterer Grund für die überlegene 
Stellung der Normal Verteilung in der Statistik. Die Approximation 
anderer Verteilungen durch die Normal Verteilung wird so durchge- 
führt, dass eine approximative Transformationsformel der einen 
Verteilung in die andere angegeben wird. Mit Hilfe einer solchen 
Approximation können dann gewünschte Schwankungsintervalle 
immer mit der Normalverteilungstabelle berechnet werden, ohne 
auf die komplizierten Tabellen der anderen Verteilungen zurück- 
greifen zu müssen. Eine solche Approximation ist natürlich nur 
unter bestimmten Bedingungen möglich. Diese Bedingung ist i. A. 
die, dass die Stichprobengröße n, die Zahl der Fälle in der Stich- 
probe, eine gewisse Untergrenze überschreitet. 
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Da die % 2 - Verteilung, wie später noch deutlich wird, i.A. 
gerade für kleine Stichproben benutzt wird, ist die Approximation 
der % 2 - Verteilung nicht besonders wichtig. 



Exkurs: 

Approximation der % 2 r Verteilung durch die Normalverteilung 
Für die yj { - Verteilung wurde festgestellt, dass sie Mittelwert 
f und Varianz 2f hat. Wenn f > 30 ist, können die Werte der % 2 f 
- Verteilung mit folgender Formel in die Normal Verteilung 
überführt werden 



z= V ( 2 % 2 f ) - V ( 2 f- 1) « N( 0, 1) 
ist approximativ standardnormalverteilt. 

Habe etwa in einer Population ein bestimmtes Merkmal eine 
Varianz von 3,7, dann sind nach Definition die Varianzen s 2 
von Stichproben der Größe 100 wie folgt verteilt: 

s 2 ~ (cr/n-1) r„-i = (3,7 / 99) r n _, = 0,037 ■ % 2 99 

Es soll nun die Transformation benutzt werden, um das 95% - 
Schwankungsintervall für diese Varianzen zu bestimmen. Das 
Intervall für die z-Verteilung ist [-1,96; 1,96]. Dann liegen 95% 
alle Werte der y 2 n -i Verteilung im rücktransformierten Intervall. 
Die Rücktransformation, d.h. die Umkehrung der obigen Trans- 
formationsformel, lautet 



X 2 f = (1/2) ( z + V(2f- l)) 2 

d.h. die Intervallgrenzen werden wie folgt rücktransformiert: 

[ 0,5 (-1,96 + V(2-99 - l)) 2 ; 0,5( 1,96 + V( 2-99 - l)) 2 ] 

= [ 0,5 (-1,96 + Vl97) 2 ; 0,5 ( 1,96 + Vl97) 2 ] 

= [0,5 ( -1,96 + 14, l) 2 ; 0,5 (1,96 + 14,1) 2 ] 

= [0,5- 147,4; 0,5 • 257,9] 

= [73,7; 129,0] 
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95% aller Werte von % 2 99 liegen also in diesem Intervall. Damit 
ist das 95% - Schwankungsintervall um die wahre Varianz der 
Population genau das Intervall 

[0,037- 73,7 ; 0,037- 129,0] 

= [2,72; 4,77] 

also ein ziemlich symmetrisches Intervall um den wahren Wert 
von 3,77. 



Für die Berechnung von Schwankungsintervallen von Anteilswer- 
ten ist jedoch die Approximation der Binomialverteilung durch die 
Normalverteilung wichtig. Sie ist unter folgenden Bedingungen 
gegeben: 



„Satz von Laplace/DeMoivre“ 

Sei B( n, 7t) eine Binomialverteilung und sowohl n7t > 5 als 
auch n(l-7t) > 5 und n > 10. Dann sind die Anteile k 

k - B(n, 7t) = N ( mt , V n7t(l-7t) ) 

approximativ normalverteilt. 

Wenn die Anteile k (0 < k < n) statt in absoluten Zahlen in rela- 
tiven Anteilen x = k/n (0 < x < 1) angegeben werden, ist x unter 
den obigen Bedingungen approximativ verteilt nach 

x~N (7t, V 7t(l-7t)/n ) 



Ist k ein binomialverteilter Parameter, so ist unter den Bedingun- 
gen des obigen Satzes der standardisierte Parameter 

kstandadisiert = (k - n7t) / V nTt(l-Tt) N(0, 1) - verteilt. 

Ist k nicht in absoluten Zahlen angegeben, sondern als relativer 
Anteil x = k/n, so ist ebenso der standardisierte Anteil 
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^standardisiert = (x - 7T) / V 7t(l-7C)/n N(0,1) - Verteilt. 

Dabei handelt es sich hier um eine Approximation besonderer Art: 
Es wird nämlich die kategoriale Binomialverteilung, die nur end- 
lich viele Werte annehmen kann, durch die stetige Normalvertei- 
lung angenähert. Zusätzlich wird eine begrenzte Verteilung durch 
eine unendliche Verteilung angenähert, denn die Binomialvertei- 
lung kann ja nur Werte zwischen 0 und der Fallzahl n annehmen, 
während die Werte der Normal Verteilung von - °° bis + °° gehen. 
Die Approximation zeigt Abbildung 7.12 
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Abbildung 7.12: Approximation der Binomialverteilung durch die Normalvertei- 
lung (Clauß u.a.:160) 



Diese Approximation ist der Grund dafür, dass es für die Binomi- 
alverteilung selten Tabellen gibt, in denen der Parameter n größere 
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Werte als ca. 20 hat, weil Stichproben, die darüber liegen, meist 
die Approximationsbedingung erfüllen und deshalb mit Hilfe der 
Normalverteilung berechnet werden können. Oben wurde mit 
Hilfe der Binomialverteilung die Genauigkeit von Stichproben mit 
20 Fällen bei der Anteilsbestimmung berechnet, am Beispiel der 
Bestimmung des Anteils der Abiturientinnen aus den ALLBUS- 
Daten, er betrug dort genau 14,2%. Es wurde gezeigt, dass die 
Stichproben mit Anteilen von 2, 3 und 4 Abiturientinnen ungefähr 
2/3 aller Stichproben der Größe 20 ausmachen. Oft ist man aber 
nicht an solchen diskreten Anteilswerten interessiert, sondern eher 
daran, für einen vorgegebenen %-Satz von Stichproben ein stetiges 
Intervall mit nicht ganzzahligen Grenzen anzugeben, innerhalb 
dessen die Anteilswerte dieser Stichproben um den wahren Wert 
liegen. 

Dazu wird die obige Approximation ausgenutzt und ein sol- 
ches Intervall mit Hilfe der Normal Verteilung bestimmt. Das obige 
Beispiel darf jedoch nicht wiederholt werden, denn für Stichpro- 
ben mit nur 20 Fällen und einem wahren Anteil von 0,142 gilt: nn 
= 20-0,142= 2,84 < 5, so dass die Voraussetzungen es Satzes von 
Laplace für eine Approximation nicht vorliegen. Es soll deshalb zu 
großen Stichproben der Größe des ALLBUS-Datensatzes, 3000 
und mehr Befragte, übergegangen werden. 

Frage: In der Grundgesamtheit haben die Abiturientinnen einen 
Anteil von = 14,2%, die Stichprobengröße sei 3000. In welchem 
Schwankungsintervall liegen 95% aller Stichproben? 

Wegen 3000-0,142 > 5 kann mit der Approximation angenommen 
werden, dass der Anteil von Abiturientinnen statt binomial verteilt 
normalverteilt ist mit 



B (3000, 0,142) ~ N(3000-0,142, V(3000-0,142-(l-0,142)) ) = 
N(426, V356,5 ) = N(426, 19,12). 

Mit dieser Approximation wird das Schwankungsintervall genau 
wie oben im Fall der Normal Verteilung berechnet: 

[ -1,96-19,12 + 426; 426 + 1,96-19,12] 

= [-37,5 + 426; 426 + 37,5] 

~ [392; 464] 
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Antwort: 95% aller Stichproben der Größe 3000 ergeben Werte 
zwischen 392 und 464 Abiturientinnen, bzw. Anteile zwischen 
392/3000 = 0,1306 = 13,06% und 464/3000 = 0,1546 = 15,46%. 

Diese Berechnung gilt natürlich ganz allgemein. Wenn man 
statt „Abiturientin“ irgendeine andere Ausprägung oder ein dicho- 
tomes Merkmal annimmt, z.B. „ist Anhänger der Grünen“, oder 
was auch immer interessiert, und dieses Merkmal hat in der Popu- 
lation einen tatsächlichen Wert um die 14%, so werden Stichpro- 
ben der Größe von 3000 Fällen immer diese Genauigkeit haben, 
dass nämlich bei 95% von ihnen der Anteilswert in der Stichprobe 
nicht weiter als ca. 1,2% vom wahren Wert abweicht. 

Weitere Literatur zu diesem Kapitel: Clauß u.a.: 135-140, 151- 
158, 161-164; Hochstädter: 449 - 458, 471 - 499, Kühnel/Krebs: 
167 - 175, 182-222 



Übungsaufgaben'. 

1. Die Zeit, die Studierende in einer Semesterwoche für die Vorbe- 
reitung von Seminaren aufwenden, sei normalverteilt mit einem 
Mittelwert von 10 h und einer Standardabweichung von 6 h. 
Bestimmen Sie, wie viele Stunden sich eine Studentin mindestens 
vorbereiten muss, um zu den 5% Studierenden zu gehören, die sich 
am längsten vorbereiten. 

2. In einem Pavillon der EXPO ergibt sich unter den augenblickli- 
chen Besuchern ein Frauenanteil von 20%, während er in einem 
anderen 70% beträgt. Sie ziehen aus beiden Besuchergruppen eine 
Stichprobe von 20 Personen. Wie hoch ist jeweils Ihre Chance, 
dass sich genau 10 Frauen und 10 Männer in der Stichprobe befin- 
den? 




Kapitel 8: Wahrscheinlichkeiten 



Im vorigen Kapitel wurden drei spezielle Häufigkeitsverteilungen 
dargestellt, nämlich theoretische Häufigkeitsverteilungen von 
Stichproben-Parametern. Um diese Stichproben- Verteilungen 
angeben zu können, war es notwendig, dass die wahren Parameter 
der Grundgesamtheit bekannt sind. Das ist nun aber in der sozial- 
wissenschaftlichen Empirie selten der Fall, sondern man hat fast 
immer nur die Stichprobe vorliegen. Man muss also das umge- 
kehrte Vorgehen wählen und die wahren Parameter aus der Stich- 
probe schätzen. 

Vorgehen bei bekannten Parametern der Grundgesamtheit: 

Wahrer” Parameter der GG bekannt 
=> Stichproben- Verteilung des wahren Parameters kann angegeben 
werden 

=> Antwort auf: Wie “nah dran” ist der Parameter einer Stichprobe 
am wahren Wert? 

Umgekehrt: 

Vorgehen bei unbekannten Parametern der Grundgesamtheit 
Nur Parameter einer Stichprobe ist bekannt 
=> Stichproben- Verteilung des Parameters kann mit Angaben aus 
der Stichprobe geschätzt werden 

=> Antwort auf: Wie “nah dran” ist der wahre Wert am Parameter 
der Stichprobe? 

Wenn diese Umkehrung des Verfahrens möglich ist, kann aus 
einer einzigen Stichprobe induktiv eine Schätzung des wahren 
Parameter- Wertes erfolgen. Bei dieser Schätzung kann man Fehler 
machen, man schätzt also mit einer gewissen Unsicherheit. Um die 
Art der Unsicherheit dieser Schätzung begrifflich und praktisch in 
den Griff zu bekommen, muss der Begriff der mathematischen 
Wahrscheinlichkeit eingeführt werden. Ziel ist, für die Schätzun- 
gen der wahren Parameter der Grundgesamtheit aus einer einzigen 

V. Müller-Benedict, Grundkurs Statistik in den Sozialwissenschaften, 

DOI 10. 1007/978-3-53 1-93225-5_8, ©VS Verlag für Sozialwissenschaften | 
Springer Fachmedien Wiesbaden GmbH 2011 
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Stichprobe heraus eine Wahrscheinlichkeit für ihre Richtigkeit 
anzugeben. 



Ziel der induktiven Statistik (auch Inferenzestatistik): 

Angabe der “Wahrscheinlichkeit” der Richtigkeit von aus der 
Stichprobe geschätzten Parametern der Population. 



8.1 Definition der Wahrscheinlichkeit 

Unter Wahrscheinlichkeit kann sich jeder etwas vorstellen, es ist 
ein Wort aus dem Alltag. Meist sind dabei einzelne Ereignisse 
gemeint, z.B. „wahrscheinlich regnet es gleich“ oder „wahrschein- 
lich habe ich den Termin verpasst“. Man verbindet jedoch damit 
intuitiv die Vorstellung einer Chance des Eintretens des geschil- 
derten Ereignisses im Verhältnis zum Nichteintreten, was sich 
auch in der Präzisierung zu Worten wie „höchstwahrscheinlich“ 
oder „weniger wahrscheinlich“ ausdrückt. Eine solche Chance 
kann man deshalb gut als den Erfahrungswert auffassen, der die 
relative Häufigkeit des Auftretens des erwarteten Ereignisses unter 
den herrschenden Bedingungen wiedergibt. Andererseits besagt 
die Formulierung aber gerade, dass das bevorstehende einzelne 
Ereignis nicht exakt vorhersehbar ist, sondern dem Zufall unter- 
liegt. 

Es gilt also bei einer Definition der Wahrscheinlichkeit, diese 
Vorstellung von relativer Häufigkeit mit der Vorstellung des Wal- 
tens des Zufalls bei jedem einzelnen Ereignis zu verbinden. Diese 
Verbindung wird durch die Vorstellung einer unendlich oft wie- 
derholten Situation, in der das Ereignis eintreten kann, hergestellt. 
An der frühen Entwicklung der Wahrscheinlichkeitstheorie waren 
vor allem die Spieler der ersten größeren Glücksspiel- 
Veranstaltungen Ende des 18. Jahrhunderts beteiligt, weil für das 
Verständnis von diesen Glücksspielen die Wahrscheinlichkeitsthe- 
orie sehr nützlich ist. Das einfachste Beispiel eines Glücksspiels ist 
der Münzwurf und der Anteil der Würfe, die „Zahl“ ergeben: 
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Abbildung 8.1: Anteil von „Zahl“ beim Münzwurt (Blalock: 117) 



Die relative Häufigkeit von „Zahl“ ist z.B. hier in Abbildung 8.1 
nach 10 Versuchen 7/10, nach 100 Versuchen 56/100, nach 1000 
Versuchen 537/1000 usf. Die Wahrscheinlichkeit von „Zahl“ ist 
dann definiert als der Grenzwert 



Definition : empirische Definition der Wahrscheinlichkeit P 
( nach Laplace, v. Mises), am Beispiel Münzwurf: 

P („Zahl“) = Anzahl „Zahl“/ Anzahl Versuche insgesamt 

mit Anzahl Versuche — » °° 



Schon durch diese Definition ist festgelegt, dass die Wahrschein- 
lichkeit immer eine Zahl zwischen 0 und 1 ist. Das ist eine empiri- 
sche Definition. Man könnte aber auch theoretisch fordern, eine 
gute Münze, die sich z.B. für ein Spiel um Geld eignet, sollte so 
gebaut sein, dass die relative Häufigkeit von „Zahl“ genau 0,5 ist. 
Man kann also Wahrscheinlichkeiten auch theoretisch für be- 
stimmte Ereignisse vorgeben, ohne dabei festlegen zu müssen, 
welches Ereignis bei einer bestimmten Realisation eintritt. 



Definition : theoretische Definition der Wahrscheinlichkeit P 
am Beispiel Münzwurf: 

Das Spiel „Münzwurf' ist definiert durch 2 Ereignisse „Zahl“ 
und „Kopf“ mit folgenden Wahrscheinlichkeiten 
P („Zahl“) = 0,5 und P(„Kopf ') = 0,5 
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Eine solche theoretische Definition liefert sozusagen ein Modell 
dessen, was bei jeder realen Münze geschehen sollte. Nur beim 
Vorhandensein eines solchen Modells kann man über reale Mün- 
zen Behauptungen der Art aufstellen, dass die Münzen „falsch“ 
seien. Ganz entsprechend benötigt man solche Modelle, um von 
einer Stichprobe sagen zu können, dass sie „verzerrt“ oder „selten“ 
sei, bzw. um die Güte einer Stichprobe einschätzen zu können. 

Deshalb ist die Beschäftigung mit theoretischen Wahrschein- 
lichkeitsmodellen wichtig. Dazu müssen einige notwendige Beg- 
riffe eingeführt werden. 



Definition : Ein Zufallsexperiment ist ein Versuch, dessen Er- 
gebnis nicht vorhersehbar ist, aber dessen mögliche Ergebnisse 
bekannt sind. Die Menge aller möglichen Ergebnisse eines Zu- 
fallsexperiments heißt Ereignisraum. 

Sei { X; } eine Zerlegung des Ereignisraums in disjunkte Ereig- 
nisse (solche, die nicht gleichzeitig auftreten können) und sei 
eine Funktion P: { X ; } -4 [0; 1] vorhanden, für die gilt: 

1. P(Xi) e [0,1] : Jedem Ereignis X, wird eine Zahl zwischen 

0 und 1 zugeordnet 

2. Yj p ( x .)=l 

Alle_i 

Dann heißt P(Xi) die Wahrscheinlichkeit des Ereignisses X,. 



Was ist eine Zerlegung in disjunkte Ereignisse? Das lässt sich 
mengentheoretisch veranschaulichen: 




E 



Abbildung 8.2: Zerlegung einer Menge, E = Ereignisraum, Ai = Elementar- 
Ereignisse (Clauß u.a.: 351) 
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Die Schnittmenge zweier Ereignisse A und B ist das Ereignis „A 
tritt ein und B tritt auch ein“. Die Vereinigungsmenge zweier Er- 
eignisse A und B ist das Ereignis „A tritt ein oder B tritt ein“. 
Disjunkte Ereignisse sind solche mit leeren Schnittmengen. Das 
bedeutet, sie können nicht gleichzeitig eintreten. Die Vereini- 
gungsmenge einer Zerlegung in disjunkte Ereignisse ist der ganze 
Ereignisraum, sie heißt das sichere Ereignis. Denn diese Vereini- 
gung bedeutet „Eins der Ereignisse, die den ganzen Ereignisraum 
ausmachen, tritt ein“ und das ist sicher, d.h. seine Wahrscheinlich- 
keit ist 1 . 

Die vielen Definitionen lassen sich alle gut an Beispielen 
verstehen. 

Beispiele für Zufallsexperimente: 

1. Zufallsexperiment: Münzwurf 
Ereignisraum: { Kopf, Zahl}, 

Ereignisse: Kopf oder Zahl 

P( Kopf) = P(Zahl) = 0,5, I P(x) = 0,5 + 0,5 = 1 

2. Zufallsexperiment: Würfel 

Ereignisraum: { „1“ bis „6“, aber auch „eine Zahl würfeln, die 
kleiner gleich 3 ist“, usw. } 

disjunkte Ereignisse einer Zerlegung: nur die Zahlen „1“ bis „6“ 
P(„l“) = ...= P(„6“) = 1/6, 1 P(x) = 6 1/6=1 

3. Seien in einer Bevölkerung 40% evangelisch, 35% katholisch 
und 25% andere Konfessionen. 

Zufallsexperiment: zufällige Auswahl einer Person 
Ereignisraum: { Eine oder eine Kombination der Konfessionen} 
Zerlegung des Ereignisraums: evangelisch, katholisch, anders 
Wie groß sind P(„evangelisch“), P(„katholisch“), ...? 

Es muss gelten: 

P( evangelisch) + P(katholisch) + P(anders) = X P =1. 

4. Zufallsexperiment: zufällige Auswahl einer Person und die 
Feststellung ihrer Größe 

Ereignisraum besteht aus Aussagen wie „ die Person ist zwi- 
schen 1,65 und 1,75 m groß“, oder „die Person ist kleiner als 
1,50 m“ etc. 
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Zerlegung in disjunkte Ereignisse: lässt sich hier nicht mehr 
angeben, da es unendlich viele gibt, wenn die Körpergröße als 
stetige metrische Variable aufgefasst wird. Aber man kann eine 
Zerlegung des Intervalls der Körpergrößen wählen, z.B. 

„kleiner als 1,60“, „1,60 bis 1,80“, „größer 1,80 m“ 

Dann muss gelten 

P(„< 1,60“) + P(„l,60 bis 1,80“) + P („ > 1,80“) = 1 



8.2 Eigenschaften der Wahrscheinlichkeit 

Mit diesen Beispielen können nun einige Wahrscheinlichkeiten 
bestimmt werden. Zunächst zum Beispiel 1: Wie groß ist die 
Wahrscheinlichkeit, zweimal hintereinander eine „Zahl“ beim 
Münzwurf zu erzielen? Dazu muss aus den bekannten Elementar- 
ereignissen das Ereignis „zweimal hintereinander Zahl“ gebildet 
werden. Zunächst wird eine Liste der möglichen Ausgänge beim 
zweimaligen Wurf aufgestellt: 

Alle möglichen Elementarereignisse des zweimaligen Münzwurfs 
sind: 

(Kopf, Kopf), (Kopf, Zahl), (Zahl, Kopf), (Zahl, Zahl). 

Das Eintreten jedes dieser Ereignisse ist gleich wahrscheinlich, da 
die jeweils enthaltenen beiden elementaren Ereignisse Kopf oder 
Zahl dieselbe Wahrscheinlichkeit 0,5 haben. Alle 4 elementaren 
Ereignisse des zweimaligen Münzwurfs sind also gleichwahr- 
scheinlich. Deshalb müssen sie alle die Wahrscheinlichkeit 14 
haben, da ihre Summe 1 ergeben muss. Die Wahrscheinlichkeit, 
zweimal hintereinander eine „Zahl“ zu erzielen, ist also 
P ( zweimal „Zahl“) = 14. 

Wenn man dieses Verfahren weiter fortsetzt, kann man die Wahr- 
scheinlichkeit beliebiger Sequenzen von Münzwürfen berechnen. 
Das ist im Galton-Brett (Abbildung 8.3) dargestellt. Die Kugeln, 
die hier in den Trichter fallen, können entweder nach links oder 
nach rechts abprallen. Ganz unten links ist z.B. abzulesen, dass 
von 4096 Kugeln nur 64 sechsmal hintereinander nach links fallen 
werden; die Wahrscheinlichkeit, sechsmal hintereinander eine 
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„Zahl“ zu werfen, ist genauso groß und deshalb berechenbar als 
64/4096 = 0,016. 




Abbildung 8.3: Das Galton-Brett (nach Sixtl: 206) 



Man hätte die Wahrscheinlichkeit für zweimal „Zahl“ werfen aber 
auch durch folgende Überlegung berechnen können: auch wenn 
ich beim ersten Mal Kopf geworfen habe, ist es gleich wahrschein- 
lich, dass ich beim zweiten Mal Kopf oder dass ich Zahl werfe. 
Das Ergebnis des zweiten Wurfs ist unabhängig von dem des ers- 
ten Wurfs. Dafür, dass beim ersten Mal Zahl kommt, ist P = Vi. 
Dafür, dass dann beim zweiten Mal wieder Zahl kommt, ist P 
wieder Vi. Die Wahrscheinlichkeit, dass beide Male hintereinander 
Zahl kommt, ist dann VtVi. Das ist eine ganz allgemeingültige 
Definition: 



Definition: Zwei Ereignisse A und B heißen stochastisch un- 
abhängig, wenn gilt, dass sich die Wahrscheinlichkeit ihres 
gemeinsamen Auftretens als ihr Produkt ergibt: 



P(A „und“ B) = P(A) P(B) 
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Der Zusatz „stochastisch“ (= im Hinblick auf zufällige Einflüsse) 
besagt hier, dass damit nichts über reale kausale Mechanismen 
ausgesagt werden kann. 

Diese Definition der Unabhängigkeit stimmt mit dem, was 
man im Alltag erwartet, überein. Wenn man z.B. annimmt, dass 
die Wahl des Studiums „Soziologie“ unabhängig vom Geschlecht 
der Studierenden ist, dann erwartet man, dass die Hälfte aller Per- 
sonen, die Soziologie studieren, Frauen bzw. Männer sind. 

Sei die Wahrscheinlichkeit, dass ein zufällig ausgewählter 
Student Soziologie studiert = 0,1 (d.h. 10% studieren Soziologie), 
dann ist bei Unabhängigkeit die Wahrscheinlichkeit, eine Sozio- 
logie studierende Frau auszuwählen 0,1 • P(Frau) = 0,1 • 0,5 = 
0,05, (d.h. dann sind 5% aller Studierenden Frauen, die Soziologie 
studieren). Wenn andererseits für die Chemie-Studierenden insge- 
samt und die Chemie studierenden Frauen gilt: p(Chemie) = 0,18 = 
18% und p(Chemie und weiblich) = 0,01 = 1%, wertet man das 
sofort als Hinweis darauf, dass die Wahl des Chemie-Studiums 
gravierend vom Geschlecht abhängt. Wenn man sich aber unsicher 
ist bzgl. der Unabhängigkeit eines bestimmten sozialen Merkmals 
von anderen sozialen Merkmalen, so bietet die obige Definition 
diese Möglichkeit der Feststellung, nämlich dadurch, ob sich die 
Wahrscheinlichkeiten des Auftretens dieser Merkmale als Produkt 
berechnen lassen. 

Ein weiteres Beispiel ist das Ziehen zweier Asse aus einem 
Stapel Karten mit und ohne Zurücklegen. Bei „mit“ ist das erste 
Ziehen unabhängig vom anderen, bei „ohne“ nicht! Das führt auf 
den Begriff der bedingten Wahrscheinlichkeit, die hier nicht weiter 
benötigt wird. Aber die Berechnung lässt sich auch so durchfüh- 
ren: 

P(zweimal Asse ohne Zurücklegen) 

= P(Ass beim ersten Ziehen „und“ aus dem Reststapel noch mal 
Ass ziehen) 

= P(Ass aus einem vollständigen Kartenspiel „und“ Ass aus ei- 
nem Kartenspiel mit nur 3 Assen). 

Weil die letzten beiden Ereignisse unabhängig sind 
=>P(zweimal Asse ohne Zurücklegen) = 4/52 • 3/51 
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Zum Beispiel 3: bei einer bekannten relativen Häufigkeit einer 
Ausprägung und einer einmaligen Ziehung ist einsichtig, dass die 
Wahrscheinlichkeit genau durch die relative Häufigkeit gegeben 
wird. Sei N die Zahl aller Menschen in der Population, dann ist bei 
0,35-N Katholiken die Chance, gerade einen Katholiken auszu- 
wählen, genau 0,35-N zu N, also 0,35. Man kann also folgern: 



Die relative Häufigkeit einer kategorialen Ausprägung x in der 
Population ist gleich der Wahrscheinlichkeit, dass ein zufällig 
ausgewähltes Element die Ausprägung x besitzt. 

Gebe es N Elemente, k davon mit Ausprägung „x“, dann ist 
P(„Element mit Ausprägung x ausgewählt“) = k/N 



Wie groß ist im Beispiel 3 die Wahrscheinlichkeit, einen „Chris- 
ten“ auszuwählen? Das Ereignis „Christ“ besteht aus den 2 Ereig- 
nissen „evangelisch“ oder „katholisch“. Da dies 2 disjunkte Ereig- 
nisse sind, können sie nur „entweder“ - „oder“ eintreten, ihre 
Wahrscheinlichkeiten addieren sich deshalb: 

P(„Christ“) = P(„evang.“) + P(„kath.“) = 0,4 + 0,35 = 0,75 = 3 /4. 

Die Wahrscheinlichkeit von disjunkten Ereignissen (von Ereignis- 
sen, die nur „entweder“ -„oder“ eintreten können), addiert sich 
also. Diese Eigenschaft ergibt sich aus der Definition der Wahr- 
scheinlichkeit. Man hätte diese Wahrscheinlichkeit auch anders 
berechnen können: die Wahrscheinlichkeit, einen „Christen“ aus- 
zuwählen, ist bei der hier gegebenen Zerlegung auch dadurch 
gegeben, dass man nicht jemanden aus der Kategorie „anders“ 
gewählt hat. „Anders“ hat eine Wahrscheinlichkeit von 0,25. We- 
gen der Aufsummierung auf 1 bzgl. der Zerlegung gilt dann: 

P(„Christ“ ) = P(nicht „anders“) = 1 - P(anders) = 1- 0,25 = 0,75. 

Nun zum Beispiel 4. Auf Grund medizinischer Untersuchungen 
ergebe sich, dass die Körpergröße angenähert normal verteilt ist mit 
N(l,70; 0,10). Jede beliebige Einteilung in Messklassen der Kör- 
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pergröße lässt sich dann durch diese Funktion approximieren. 
Damit können die relativen Häufigkeiten, die man für beliebige 
Messklassen mit Hilfe der Normal Verteilung berechnen kann, 
ebenso als Wahrscheinlichkeiten interpretiert werden wie die rela- 
tiven Häufigkeiten bei diskreten Ereignissen. Mit dieser Annahme 
ist die Messung der Körperlänge einer zufällig ausgewählten Per- 
son ein Zufallsexperiment unter der Voraussetzung irgendeiner 
vorgegebenen Zerlegung unter der Häufigkeitsverteilung N(l,70; 
0,10). Das bedeutet, die Wahrscheinlichkeit, dass eine zufällig 
ausgewählte Person z.B. zwischen 1,60 und 1,75 groß ist, ist gleich 
der Fläche über [1,60; 1,75] unter N(l,70; 0,10). Das lässt sich 
verallgemeinern: 



Ein Flächenstück über einem Intervall [a; b] unter einer stetigen 
Verteilungskurve eines Merkmals x in einer Population ist 
gleich der Wahrscheinlichkeit, dass das Merkmal bei einer zu- 
fällig ausgewählte Person einen Wert aus dem zugehörigen In- 
tervall [a, b] hat. 



Wie groß ist dann z.B. die Wahrscheinlichkeit, eine Person auszu- 
wählen, die kleiner als 1,50 ist? Aus dem vorangehenden Kapitel 
ist bekannt, dass sich bis zum Wert 1.96 a + (a. genau 0,025 = 
2,5% der Fläche von N(|t, G) befindet. Für die spezielle N(l,7; 0,1) 
ist dieser Wert - 1,96-0,1 + 1,70 = -0,196 + 1,7 = 1,504, so dass die 
Frage so beantwortet werden kann: 

Körpergröße sei normal verteilt N(l,7; 0,1 ) => 

P(zufällig gewählte Person ist < 1,50m) = 

Fläche unter N(l,7; 0,1) bis zum Wert 1,504 = 0,025. 

Die Wahrscheinlichkeit, eine Person kleiner als 1,50 m auszuwäh- 
len beträgt ca. 0,025 = 2,5%. 
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8.3 Entsprechungen zwischen empirischen Verteilungen und 
W ahrscheinlichkeits Verteilungen 

Durch die in den letzten beiden Beispiele festgestellte Gleichheit 
zwischen der relativen Häufigkeit einer Ausprägung in der Grund- 
gesamtheit und der Wahrscheinlichkeit, dass ein zufällig ausge- 
wähltes Element diese Ausprägung besitzt, entsteht eine Analogie 
zwischen allen bisherigen Begriffen, die zur deskriptiven Be- 
schreibung der Häufigkeiten in einem Datensatz verwendet wer- 
den, und den Wahrscheinlichkeiten, die ein Zufallsexperiment auf 
diesen Daten bestimmen. 

Als Entsprechung für die Fälle auf der empirischen Seite, die 
eine bestimmte Ausprägung k eines Merkmals X besitzen, steht in 
der Wahrscheinlichkeitstheorie eine sog. Zufallsvariable X, die die 
Ausprägung (als Code-Zahl) des Merkmals X angibt, die bei der 
zufälligen Auswahl einer Person angetroffen wird. 



Definition : Eine Zufallsvariable ZV ist eine Funktion, die je- 
dem möglichen Ergebnis eines Zufallsexperiments eine Zahl 
zuordnet. ZV sind sozusagen die Vercodungen. Beispiel Wür- 
fel: Ergebnis einer Zufallsvariable „Würfel“ sind die Zahlen 1 
bis 6; Beispiel „Körpergröße“: Ergebnis einer ZV ist eine Zahl 
zwischen 1,20 m und 2,50 m 



Analog zur Häufigkeitsverteilung der Ausprägungen eines Merk- 
mals gibt es nun ebenso eine Wahrscheinlichkeitsverteilung für 
eine Zufalls variable, und analog zur kumulierten Häufigkeitsver- 
teilung eines Merkmals gibt es eine kumulierte Wahrscheinlich- 
keitsverteilung einer Zufallsvariable. 

Nachdem nun schon die Analogien zwischen relativer Häufig- 
keit und Wahrscheinlichkeit, zwischen Zufallsvariablen und Ver- 
codungen beschrieben sind, können als letztes auch noch wahr- 
scheinlichkeitstheoretische Entsprechungen für Mittelwert und 
Varianz definiert werden. Der Mittelwert sagt aus, wie viel man im 
Durchschnitt erwarten kann. Der Mittelwert der Fernsehbeteili- 
gung an einer Serie sagt z.B., wie viele Zuschauer langfristig die 
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Serie sehen. Wenn nun ein Zufallsexperiment ständig wiederholt 
wird, wie das Werfen einer Münze, so kann man ebenfalls lang- 
fristige Aussagen machen, wie in Abb. 8.1 zu sehen ist. Man kann 
z.B. langfristige Durchschnitte berechnen, etwa die durchschnittli- 
che Würfelzahl bei 100 oder mehr Würfen. Bei einer Wahrschein- 
lichkeitsverteilung spricht man statt vom Mittelwert vom Erwar- 
tungswert. Das ist der Wert, der sich ergibt, wenn man den Durch- 
schnitt aus unendlich vielen Zufallsexperimenten bildet. Er wird 
wie folgt berechnet: 



Definition: Sei X eine Zufallsvariable, seien (Xi), i = l,...k, die 
Werte von X auf einer disjunkten Zerlegung und seien P(Xi) 
die zugehörigen Wahrscheinlichkeiten 
Der Erwartungswert E(X) ist dann 
k 

E(X)=£ XiP(Xi) 

i=i 



Beispiel: der Erwartungswert beim Würfeln: 

6 6 

E(X) i - 1/6 = 1/6 - ^ i = 1/6 - (1+2+3 +4+5 +6) 

i=i i=i 

= 1/6-21 =3,5 

Im langfristigen Durchschnitt würfelt man also eine 3,5; wenn man 
100 Würfe addiert und durch die Anzahl der Würfe teilt, ergibt 
sich eine Zahl nahe bei 3,5. 

Ebenso ist für Zufallsvariable die Varianz definiert als der 
Erwartungswert der quadrierten Abweichungen vom Erwartungs- 
wert, also ganz analog zur Definition der Varianz für empirische 
Verteilungen: 

Var(X) = E( (X - E(X)) 2 ) 



In der folgenden abschließenden Tabelle 8.1 sind die Entsprechun- 
gen zwischen den Begriffen, mit denen eine empirische Verteilung 
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beschrieben wird, und den wahrscheinlichkeitstheoretischen Beg- 
riffen, mit denen die Verteilungen von theoretischen Zufallsvariab- 
len beschrieben werden, aufgelistet. Der Unterschied ist, dass sich 
die empirischen Begriffe auf real existierende empirische Merkma- 
le beziehen, während die wahrscheinlichkeitstheoretischen Begrif- 
fe die Eigenschaften von Ereignisräumen beschreiben, in denen 
den Ereignissen auf theoretische Weise Wahrscheinlichkeiten 
zugewiesen werden. 



Tabelle 8.1: Gegenüberstellung empirischer und theoretischer 
Begriffe 



Empirische Häufigkeitsver- 
teilungen 

deskriptive Begriffe 


W ahrscheinlichkeits Vertei- 
lungen, 

theoretische Begriffe 


Merkmal 


Ereignisraum 


Ausprägung, Wert 


Ereignis 


Personen haben Wert k bei 


Zufalls variable X hat den Wert 


Merkmal X 


k 


Kategoriale Daten: Häufigkeit 


diskrete Wahrscheinlichkeit 


f(X=k), rel. Häufigkeit p(x=k) 
= f(x=k)/N 


P( X = k) 


kumulierte Häufigkeit F( x < k) 


kumulierte Wahrscheinlichkeit 
P( X < k) = F(k) 


Intervallskalierte Daten: rel. 


stetige W. -Verteilung 


Häufigkeit, dass f(a<x<b) = 
F( b)-F(a) 


P( a < X < b) = F(b) - F(a) 


Mittelwert X 


Erwartungswert E(X) 


Varianz s 2 


Varianz E( (X - E(X)) 2 ) 


Vercodung 


Zufallsvariable 



Die Übereinstimmung geht bis in die gebräuchlichen Buchstaben. 
Damit wird eine grundlegende Uminterpretation eines empirischen 
Datensatzes möglich: 
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Interpretation einer Stichprobe von Befragten der Größe n in 
der induktiven Statistik: 

Die festgestellte Häufigkeitsverteilung eines Merkmals bei n 
Befragten ist der Ausgang von n Zufallsexperimenten, deren 
Ergebnisse durch diejenige Wahrscheinlichkeitsverteilung be- 
stimmt sind, die durch die Häufigkeitsverteilung der Ausprä- 
gungen des Merkmals in der Grundgesamtheit gegeben ist. 



Weitere Literatur. Clauß u.a.: 93-134, Hochstädter: 353-445, 
Knapp, Kühnel/Krebs: 107-154 



Übungsaufgaben : 

1. Die Wahrscheinlichkeit, mit einem Würfel eine Zahl zwischen 1 
und 6 zu werfen, ist gleichverteilt. Wie groß ist dann die Wahr- 
scheinlichkeit, 

a) beim ersten Wurf eine 5 oder eine 6 zu werfen? 

b) bei zwei Würfen nacheinander zusammen eine Zahl > 1 1 zu 
werfen? 

2. Der Intelligenzquotient IQ sei in der Bevölkerung normalverteilt 
mit N(100; 20). Wie groß ist die Wahrscheinlichkeit, dass eine 
beliebig ausgewählte Person einen IQ > 133 hat? 







Kapitel 9: Konfidenzintervalle 



In diesem Abschnitt wird dargestellt, wie mit den in den beiden 
vorangehenden Teilen bereitgestellten Mitteln - den theoretischen 
Verteilungen und dem Wahrscheinlichkeits-Begriff - der Indukti- 
onsschluss von den Parametern der Stichprobe auf die wahren 
Parameter der Grundgesamtheit vollzogen werden kann, ohne dass 
diese selbst bekannt sind. 



9.1 Umformulierung empirischer Daten als Ergebnisse von 
Zufallsexperimenten 

Zuletzt wurde ein empirischer Datensatz so uminterpretiert, dass er 
als Ergebnis eines Zufallsexperiments erscheint. Mit dieser Inter- 
pretation und mit den weiteren Begriffsbestimmungen des voran- 
gehenden Abschnitts kann nun das zentrale mathematische Ergeb- 
nis exakter formuliert werden, das die Grundlage für die Bedeu- 
tung der Normalverteilung bildet und die Verbindung zwischen 
empirischen Verteilungen und theoretischen Verteilungen herstellt. 



„Zentraler Grenzwertsatz“ 

Seien n > 30 und X n (i= 1 n) voneinander unabhängige Zu- 
fallsvariable mit identischen Verteilungen, mit Erwartungswert 
E(X) = (f und Standardabweichung o. Dann ist der Mittelwert 
der Zufallsvariablen approximativ normalverteilt mit folgenden 
Parametern 



V. Müller-Benedict, Grundkurs Statistik in den Sozialwissenschaften, 

DOI 1 0.1 007/978-3-53 1-93225-5 9, ©VS Verlag für Sozialwissenschaften | 
Springer Fachmedien Wiesbaden GmbH 2011 



n 
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Der Satz besagt, dass sich bei Hinzunahme immer weiterer identi- 
scher Zufallsexperimente die Verteilung der Mittelwerte dieser 
Zufallsexperimente immer mehr einer Normal Verteilung annähert. 
Ein Beispiel dafür bieten die Summen bei ein-, zwei- und dreima- 
ligem Würfeln. Die Wahrscheinlichkeitsverteilung des einmaligen 
Würfelwerfens ist natürlich die Gleichverteilung. Bei zweimali- 
gem Werfen und bei dreimaligem Werfen erhält man die folgen- 
den Kurven in Abbildung 9. 1 : 





Abbildung 9.1: Wahrscheinlichkeitsverteilung bei 2- und 3-maligem Würfeln 
(Blalock: 184f.) 
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Angegeben ist jeweils die Wahrscheinlichkeit, d.h. der normierte 
Wert (bei zwei Würfen die Summe der Würfe geteilt durch 2, bei 
drei Würfen Summe/3). Schon bei drei Würfen zeigt sich die Ges- 
talt der Normalverteilung. Je mehr Würfe man tätigt und aufsum- 
miert, desto stärker nähert sich die Verteilung dieser Form an. Da 
aber die Augenzahl bei gleichzeitigem Wurf mehrerer Würfel, 
dividiert durch die Anzahl Würfel, dasselbe ist wie der Mittelwert 
von einem Würfel, der diese Anzahl oft geworfen wurde, zeigt 
dieses Beispiel, wie nach dem zentralen Grenzwertsatz die Nor- 
malverteilung immer genauer approximiert wird, je mehr identi- 
sche Zufallsexperimente man veranstaltet. 

An den nunmehr in der Sprache der Wahrscheinlichkeitstheo- 
rie formulierten Voraussetzungen des Satzes lässt sich ablesen, 
wann genau Stichproben geeignet sind für den Induktionsschluss 
von der Stichprobe auf die Grundgesamtheit: alle Elemente der 
Stichprobe müssen identische Zufallsexperimente darstellen, die- 
selbe Wahrscheinlichkeitsverteilung besitzen. Dadurch ist festge- 
legt, dass man bei der Festlegung der Befragten für eine Stichpro- 
be nur eine einzige Möglichkeit hat, die der Zufallsziehung aus der 
gesamten Grundgesamtheit. Denn sobald man ein bestimmtes 
Kriterium für die Auswahl wählt, grenzt dieses immer eine Teil- 
menge aus der Grundgesamtheit ab, die dann, weil nur sie dieses 
Kriterium besitzt, eine andere Wahrscheinlichkeitsverteilung hat 
wie die übrigen. 

Wenn man z.B. Aussagen über „die Frauen“ machen will, 
kann man nicht eine Stichprobe von Brigitte-Leserinnen nehmen, 
da unklar ist, inwieweit sich die Brigitte-Leserschaft von anderen 
Frauen unterscheidet. Man darf also gerade kein Auswahl- 
Kriterium anwenden, und das heißt: Zufall. Diese wichtige Bedin- 
gung für Stichproben hat auch eine Bezeichnung: 



Definition : Eine Stichprobe heißt repräsentativ, wenn alle Fäl- 
le der Stichprobe ein identisches Zufallsexperiment nach den 
Voraussetzungen des zentralen Grenzwertsatzes darstellen. 
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Im Weiteren wird natürlich angenommen, dass diese Vorausset- 
zung immer erfüllt ist. 

Was hat man nun mit dieser wahrscheinlichkeitstheoretischen 
Uminterpretation empirischer Daten gewonnen? Die Befragten 
einer einzigen Stichprobe bilden jetzt ein Zufallsexperiment, des- 
sen Ausgang durch die Häufigkeitsverteilung der Population be- 
stimmt ist. Die Parameter der bei den Befragten ermittelten Häu- 
figkeitsverteilung weichen von den wahren Parametern der Vertei- 
lung in der Gesamtpopulation zufällig ab, d.h. nach den Gesetzen 
von Zufallsexperimenten. Der zentrale Grenzwertsatz z.B. be- 
schreibt die Wahrscheinlichkeit dafür, dass sich der bei den Be- 
fragten ermittelte Mittelwert dem in der Population vorhandenen 
annähert. Es reicht also aus, nur eine einzige Stichprobe zu ziehen, 
weil man die Wahrscheinlichkeiten der Abweichungen in der 
Stichprobe mathematisch berechnen kann. Die drei theoretischen 
Verteilungen von Parametern aus Kapitel 7 lassen sich deshalb mit 
der obigen Uminterpretation als Wahrscheinlichkeitsverteilungen 
der empirischen Parameter auffassen, die von Stichproben berech- 
net werden: 



Wahrscheinlichkeitsverteilungen empirischer Parameter 

- Die Normalverteilung ist die Wahrscheinlichkeitsverteilung 
des Mittelwerts aus einer Zufallsstichprobe 

- Die x 2 - Verteilung ist die Wahrscheinlichkeitsverteilung der 
Varianz einer Zufallsstichprobe 

- Die Binomialverteilung ist die Wahrscheinlichkeitsverteilung 
des Anteils einer Ausprägung in einer Zufallsstichprobe. 



9. 2. Konfidenzintervalle 

Als letzte Frage bleibt nun, wie die Kenntnis der Wahrscheinlich- 
keitsverteilung der Parameter einer Stichprobe dazu verhilft, auf 
die wahren Werte der Grundgesamtheit zu schließen. Als erstes 
Beispiel soll die folgende Frage beantwortet werden: Wie kann der 
unbekannte Mittelwert p einer Grundgesamtheit aus einer Stich- 
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probe geschätzt werden? Angenommen sei zunächst noch, dass 
wenigstens die Standardabweichung der Grundgesamtheit bekannt 
ist und er beträgt. Eine Stichprobe vom Umfang n sei gezogen. Die 
theoretische Verteilung von Mittelwerten von Stichproben ist nach 
der Uminterpretation genau die Wahrscheinlichkeitsverteilung des 
Mittelwerts X dieser einen Stichprobe. Sie ist nach dem zentralen 
Grenzwertsatz die Verteilung N(p, c/Vn), X ~ N(p, c/Vn). 

Die Wahrscheinlichkeit eines Ereignisses entspricht der relati- 
ven Häufigkeit unter der Wahrscheinlichkeitsverteilung. Also lässt 
sich damit, dass innerhalb des Intervalls [-1,96 • c/Vn + p; p + 1,96 
• c/Vn] 95% der Fläche dieser Verteilung liegen, folgende Wahr- 
scheinlichkeit ableiten: 

PC-1,96- c/Vn + p < X < p + 1,96- c/Vn) = 0,95 
In den 3 Teilen der Bedingung wird p abgezogen 

O P(-l,96- c/Vn < X - p < 1,96- c/Vn) = 0,95 
Alle Teile der Bedingung werden mit -1 multipliziert 

O P( 1 ,96- c/Vn > p - X > -1,96- c/Vn) = 0,95 
In allen drei Teilen wird X addiert 

O P(l,96- c/Vn + X > p > X -1,96- c/Vn) = 0,95 
Die Seiten der Ungleichung werden vertauscht 

O PC-1,96 c/Vn + X < p < X + 1,96- c/Vn) = 0,95 

Durch diese Äquivalenz-Umformungen wurden die Rollen des 
empirischen und bekannten Mittelwerts der Stichprobe X und des 
unbekannten wahren Mittelwerts p der Grundgesamtheit ver- 
tauscht, mit folgendem Resultat: die Wahrscheinlichkeit, dass der 
gesuchte wahre Wert p innerhalb eines symmetrischen Intervalls 
um den geschätzten Wert X liegt (letzte Zeile der Umformung), ist 
genauso groß wie die Wahrscheinlichkeit, dass der geschätzte 
Wert in einem bestimmten Schwankungsintervall um den wahren 
Wert liegt (erste Zeile der Umformung). Das führt zu einer neuen 
Definition: 
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Definition : Sei m ein aus einer Stichprobe geschätzter Parame- 
ter eines wahren Werts M in der Grundgesamtheit und sei f die 
Wahrscheinlichkeitsverteilung des Parameters m. Ein Konfi- 
denzintervall zum Niveau a um m ist ein Intervall [f„/ 2 ; fi-oßL 
das um den geschätzten Parameter m herum liegt und in dem 
der unbekannte wahre Wert M sich mit Wahrscheinlichkeit 1-a 
befindet. Man sagt auch „(1-a) 100 %-Konfidenzintervall“. 

P(f a/2 <M<f 1 . a/2 ) = 1 - a 



Der entscheidende Unterschied zum Schwankungsintervall aus 
Kap. 7.4 ist, dass hier der wahre Parameter p nicht mehr benötigt 
wird, sondern im Gegenteil eine Aussage über seine wahrscheinli- 
che Größe gemacht wird: er liegt mit Wahrscheinlichkeit 1-a zwi- 
schen fa /2 und fi_a/ 2 - In Abbildung 9.2 sind eine Reihe solcher Kon- 
fidenzintervalle abgebildet, die sich aus jeweils anderen Stichpro- 
ben ergeben haben könnten. 




Abbildung 9.2: Verschiedene mögliche Konfidenzintervalle um einen wahren 
Parameter (Blalock: 210) 
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Damit ist die Frage beantwortet: der Schluss von der Stichprobe 
auf die unbekannten wahren Werte der Grundgesamtheit wird in 
der Weise vorgenommen, dass ein Intervall um den aus der Stich- 
probe geschätzten Wert angeben wird, innerhalb dessen sich der 
wahre Wert befindet, und zwar mit einer Wahrscheinlichkeit, die 
wählbar ist, denn der Wert für a ist nicht festgelegt. 

Was bedeutet diese Angabe eines Niveaus a für die Sicher- 
heit, mit welcher man den wahren Wert bestimmen kann? Sei als 
Beispiel ein 5%-Niveau gewählt. Dann liegt mit 95% Wahrschein- 
lichkeit der wahre Wert in den Grenzen des ermittelten Konfidenz- 
intervalls. 95% Wahrscheinlichkeit für den Erfolg eines Zufallsex- 
periments heißt aber nach der Definition der Wahrscheinlichkeit, 
dass auf lange Sicht 95 von 100 solcher Experimente Erfolg haben, 
jedoch 5% Misserfolg. Für das Konfidenzintervall bedeutet das, 
dass in - auf lange Sicht - 95 von 100 solcher Konfidenzintervalle 
sich der wahre Wert tatsächlich darin befindet, in 5 von 100 Kon- 
fidenzintervallen aber nicht. D.h. man kann das Niveau a auch so 
interpretieren, dass es die Wahrscheinlichkeit angibt, ein falsches 
Konfidenzintervall anzugeben. Das Niveau a eines Konfidenzin- 
tervalls für einen Parameter gibt die Wahrscheinlichkeit an, dass 
sich der gesuchte wahre Parameter nicht darin befindet. Wie man 
aus den konkreten Formeln entnehmen kann, ist es so, dass das 
Intervall umso länger wird, je kleiner dieser Fehler, d.h. das Ni- 
veau a, sein soll. 



Vorgehen beim Bestimmen von Konfidenzintervallen für einen 
Kennwert x in einer Stichprobe: 

1. Man ermittelt den Schätzwert für x, „ X “ aus der Stichprobe. 

2. Man stellt die theoretische Wahrscheinlichkeitsverteilung f 
eines solchen Kennwerts x fest. 

3- Man schätzt die Parameter der Wahrscheinlichkeitsverteilung 
f mit Hilfe von weiteren Angaben aus der Stichprobe. 

4. Man setzt ein Niveau a für die Fehlerwahrscheinlichkeit fest. 
Man bestimmt die f aJ2 und f|_ riy2 - Werte für diese Wahr- 
scheinlichkeitsverteilung. 

5. Das Konfidenzintervall ist dann das Intervall [f^; f 1 - 0 / 2 ] - 
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Im Folgenden soll ein Beispiel das Vorgehen bei der Berechnung 
eines Konfidenzintervalls demonstrieren. Folgende Frage sei ge- 
stellt: 

Frage: schätzen sich die Deutschen insgesamt mehr links oder 
mehr rechts ein? 

Als Datengrundlage dient eine bekannte Frage in Interviews, näm- 
lich die Selbsteinschätzung auf einer Links-Rechts-Skala. Haben 
sich die Deutschen auf dieser Skala im Durchschnitt mehr links 
oder mehr rechts eingeordnet? Da die Skala 10-teilig ist und mit 
dem Wert 1 beginnt, besteht die Mitte genau aus dem Wert 5,5. 



links 

01 02 01 04 OS M 02 VS 0V 



rechts 



Abbildung 9.3: Links-Rechts-Selbsteinschätzungsskala aus dem ALLBUS 



Tabelle 9.1: Links-Rechts-Selbsteinstufung 1994 (V 123 ALLBUS)) 

Statistiken 



LINKS-RECHTS-SELBSTEINSTUFUNG, BEFR. 



N Gültig 


3380 


Fehlend 


70 


Mittelwert 


5,03 


Standardabweichung 


1,67 


Varianz 


2,78 



Dann stellt aber die tatsächliche Abweichung von diesem theoreti- 
schen Mittelwert der Skala dar, ob sich die Deutschen durch- 
schnittlich auf dieser Skala mehr links oder mehr rechts von der 
vorgegebenen Mitte verorten. Damit ist natürlich nichts darüber 
gesagt, ob diese Mitte der Skala tatsächlich die Mitte in einem 
Kontinuum politischer Ansichten darstellt, oder ob etwa die Beg- 
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riffe „links“ und „rechts“ überhaupt Pole darstellen oder zumindest 
Pole, die gleichweit von einer Mitte entfernt sind. Das sind kriti- 
sche Fragen der Konstruktion einer solchen Skala. Hier interessiert 
nur, ob die Stichprobe hergibt zu behaupten, dass sich die Deut- 
schen insgesamt im Durchschnitt links oder rechts von der Mitte 
eingeordnet haben. 

Antwortkriterium also: Die Abweichung des tatsächlichen Mittel- 
werts dieser Skala für alle Deutschen vom theoretischen Mittel- 
wert 5,5. 

Die Skala hat in der ALLBUS -Stichprobe von 3380 Menschen den 
Mittelwert X = 5,03 (s. Tabelle 9.1), der fast einen halben Punkt 
hin zum linken Lager liegt. Das Problem des Schlusses auf die 
Grundgesamtheit ist nun: ist dieses Ergebnis aus der Stichprobe 
auf alle Deutschen übertragbar, angenommen, die Stichprobenzie- 
hung sei tatsächlich in der vorgeschriebenen zufälligen Weise 
erfolgt? Aus dem obigen ist klar, dass man hier nicht mit ja oder 
nein antworten kann, sondern nur mit Antworten derart: 

mit x % Wahrscheinlichkeit ja 
mit y % Wahrscheinlichkeit nein 

Es soll zunächst eine Antwort mit mittlerem Sicherheitsniveau 
gegeben werden, d. h. eine Antwort zum Niveau a = 5%. Damit 
kann das Antwortkriterium präzisiert werden: 

Antwortkriterium: Wie weit weicht der mittlere Skalenwert 5,5 
vom 95%-Konfidenzintervall (Niveau a = 5%) des Mittelwerts der 
Skala von 5,03 ab? 

Es muss also ein Konfidenzintervall konstruiert werden. Die 
Wahrscheinlichkeitsverteilung des Mittelwerts der Stichprobe ist 
eine Normal Verteilung mit den Parametern Mittelwert der Grund- 
gesamtheit und Standardfehler, der aus der Standardabweichung 
der Grundgesamtheit berechnet werden muss. Die Standardabwei- 
chung oder die Varianz der Grundgesamtheit ist aber genauso 
unbekannt wie der wahre Mittelwert. Hier ergibt sich also noch 
einmal dasselbe Problem wie bei der Schätzung des Mittelwerts, 
die gerade stattfinden soll: wie sicher ist der Varianzwert der 
Stichprobe derselbe wie der Varianzwert in der Grundgesamtheit? 
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Aber dieses Problem sei zunächst wieder beiseite gelassen und die 
unbekannte Varianz durch die Varianz der Stichprobe geschätzt, 
die 2,78 beträgt. Die Wurzel daraus ist die Standardabweichung: 
1,67 (Tabelle 9.1). Mit der oben angegebenen Vorgehens weise 
ergibt sich: 

1. Mittelwert der Stichprobe ist X = 5.03 (Schätzwert von p) 

2. Der Mittelwert der Stichprobe ist normalverteilt. 

3. Die Parameter sind p und der Standardfehler. Er kann aus der 
geschätzten Standardabweichung der Grundgesamtheit 1,67, 
und dem Stichprobenumfang n berechnet werden. Also 
X - N (p, 1,67/ V 3380) = N (5,03; 0,028) 

4. Das Niveau a soll 0,05 sein. Damit sind die kritischen Werte 
die z a - Werte der Standardnormalverteilung z 0 .025 = -1,96 und 
Zo.975 = 1 -96 

5. Das Konfidenzintervall für den wahren Mittelwert p in der 
Grundgesamtheit zum Niveau 95% ist dann 

[-1,96-0,028 + 5,03; 5,03 + 1,96-0,028] = [4,97; 5,08 ] 

Damit ist die Antwort auf die Frage, wie sich die Deutschen insge- 
samt auf der Links-Rechts-Skala verorten, gegeben: 

Antwort: mit 95% Sicherheit schätzen sich die Deutschen im 
Durchschnitt links von der Mitte der Links-Rechts-Skala ein. 

Will man nun ganz sicher gehen und die Wahrscheinlichkeit auf 
99% vergrößern, so müssen in dieser ganzen Rechnung nur die z a 
- Werte entsprechend verändert werden, weil a dann ja 0,01 ist. 
Einer Tabelle für die Normal Verteilung kann man die entsprechen- 
den und gleich noch andere Werte entnehmen: 

Wahrscheinlichkeit = 99% => a = 0,01 und z aJ2 = - 2,51. 

Wahrscheinlichkeit = 99,9% => a = 0,001 und z oj 2 = - 3,3 

Konfidenzintervall Niveau 0,01: 

[-2,57-0,028 + 5,03, 5,03 + 2,57-0,028] = [4,95; 5,1 ] 
Konfidenzintervall Niveau 0,001: 

[-3,3-0,028 + 5,03, 5,03 + 3,3-0,028] = [4,93; 5,12] 
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Man sieht, dass das Intervall, in dem mit immer größer wer- 
dender Wahrscheinlichkeit der wahre Wert liegt, immer länger 
wird. In Bezug auf die Fragestellung sieht man aber auch, dass 
selbst bei der sehr hohen Forderung einer Wahrscheinlichkeit von 
99,9% das Intervall immer noch weit von dem mittleren Wert 5,5 
der Skala entfernt liegt, so dass fast mit Gewissheit behauptet 
werden kann, dass die Deutschen insgesamt sich auf dieser Skala 
im Durchschnitt ein wenig links von der Mitte einstufen. 

Bisher wurde vorausgesetzt, dass die Varianz der Grundge- 
samtheit bekannt ist. Das ist i.A. nicht der Fall, sondern sie muss 
aus der Stichprobe geschätzt werden. Als Schätzwert für die Vari- 
anz der Grundgesamtheit nimmt man (ebenso wie beim Mittel- 
wert) die Varianz der Stichprobe. Aus diesem Grund muss bei der 
Berechnung der Varianz der Stichprobe auch durch n-1 dividiert 
werden, nicht wie bei einer Grundgesamtheit durch n. Denn nur 
dann stellt die Varianz der Stichprobe eine optimale, d.h. „unver- 
zerrte“ Schätzung der Grundgesamtheits- Varianz dar. Dass bei 
dieser Verwendung der Stichproben- Varianz als Schätzung der 
Grundgesamtheits- Varianz die obigen Herleitungen richtig blei- 
ben, sind tiefere Ergebnisse der Statistik. 

Bei kleineren Fallzahlen als im zentralen Grenzwertsatz ange- 
geben, also n < 30, ist allerdings die Wahrscheinlichkeitsverteilung 
des Stichprobenmittelwerts aus diesem Grund nicht mehr eine 
Normalverteilung, sondern die Approximation an die Normalver- 
teilung erfolgt zu langsam. Der Mittelwert folgt dann einer noch 
anderen Verteilung, die hier nicht behandelt wird, der t-Verteilung. 
Bei großen Stichproben von n > 30 gibt es jedoch keinen wesentli- 
chen Unterschied mehr zur obigen Berechnung an Hand der Nor- 
malverteilung. 



Ist die Varianz c 2 der Grundgesamtheit unbekannt, wird zur 
Schätzung von a 2 die Stichproben- Varianz s 2 genommen. Bei 
kleinen Stichproben (n < 30) wird das Konfidenzintervall des 
Mittelwerts mit der t-Verteilung berechnet. 
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9. 3. Konfidenzintervalle und Test auf Null 

Im obigen Beispiel wurde das 95%-Konfidenzintervall für den 
Mittelwert aus empirischen Daten der Links-Rechts-Skala berech- 
net und mit einem theoretischen mittleren Wert dieser Skala ver- 
glichen. Da der theoretische Wert von 5,5 nicht im Intervall von 
[4,97; 5,08] lag, konnte geschlossen werden, dass mit 95%-iger 
Wahrscheinlichkeit sich auch alle Personen der Grundgesamtheit, 
also hier alle Deutschen, linker einschätzen als dieser mittlere 
Wert. Man nennt dieses Verfahren auch einen Test, nämlich den 
Test dafür, ob sich ein über eine Stichprobe geschätzter Parameter 
einer Grundgesamtheit tatsächlich von einem theoretischen Wert 
unterscheidet. 



Definition : Ein Test stellt fest, ob sich ein aus einer Stichprobe 
geschätzter Parameter einer Grundgesamtheit von einem vorge- 
gebenen Wert tatsächlich unterscheidet. Er wird durchgeführt, 
indem ermittelt wird, ob sich der vorgegebene Wert innerhalb 
des Konfidenzintervalls des geschätzten Werts zum Niveau a 
befindet. Liegt er innerhalb, so lautet das Test-Ergebnis: Kein 
Unterschied; liegt er außerhalb, so lautet es: es besteht ein Un- 
terschied. Man sagt dann auch, der Unterschied ist signifikant 
zum (Fehler-)Niveau a. 




Abbildung 9.4: Test und Konfidenzintervall: nur unten sind X und Li signifikant 
unterschiedlich (Blalock 1979: 212) 
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Als soll getestet werden, ob sich die Verortung auf der Links- 
Rechts-Einschätzung bei den Bundesbürgern vom Jahr 1994 auf 
das Jahr 1996 verändert hat. 

Frage: Hat sich der Mittelwert für alle Bundsbürger auf der Links- 
Rechts-Skala von 1994 auf 1996 verändert? 

Statistische Formulierung: Liegt der empirische Mittelwert der 
Daten von 1994 außerhalb eines Konfidenzintervalls zum Niveau 
a des Mittelwerts von 1996? 

Tabelle 9.2: Links-Recht-Selbsteinstufung 1996 (VI 12 ALLBUS ) 



LINKS-RECHTS-SELBSTEINSTUFUNG, BEFR. 



N Gültig 


3442 


Fehlend 


76 


Mittelwert 


5,20 


Standardabweichung 


1,77 


Varianz 


3,14 



Aus den Daten der Tabelle 9.2 ergibt sich das Konfidenzintervall 
für 1996 zu 

[z aj 2 • 1,77 / V3442 + 5,20; 5,20 + 1,77/ V3442 • z ^ 

Das ergibt z.B. zum Niveau a = 0,05 = 5% 

[-1,96-0,03 + 5,20; 5,20 + 1,96-0,03] = [5,14; 5,26] 

oder zum Niveau a = 0,0001 

[-4,0 • 0,03 + 5,20; 5,20 + 4,0 • 0,03] = [5,08; 5,32] 

Da der Wert für 1994 5,03 beträgt und in beiden Fällen außerhalb 
der Konfidenzintervalle liegt, kann man mit sehr großer statisti- 
scher Sicherheit sagen, dass von 1994 auf 1996 die Selbsteinstu- 
fung der Deutschen auf dieser Skala im Durchschnitt „rechter“ 
geworden ist, wenn auch nur ein klein wenig. 



Antwort: Der Mittelwert der Links-Rechts-Selbsteinstufung von 
1996 ist signifikant (zum Niveau 0,001) „rechter“ als der von 
1994. 
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Anzumerken ist hier, dass ein statistisch besserer Unterschiedstest, 
der nicht wie hier den Unterschied eines "wahren" Werts von ei- 
nem Stichprobenwert, sondern den Unterschied zweier "wahrer" 
Werte aus den Werten zweier Stichproben ermitteln soll, beide 
Konfidenzintervalle berücksichtigen muss. Das leistet der sog. t- 
Test, der nicht zum Umfang dieses Buches gehört. 

In vielen Fällen geht der Test darum, ob bestimmte Parameter, z.B. 
solche, die anzeigen wie stark ein Zusammenhang zwischen zwei 
Variablen ist (s. die folgenden Kapitel), überhaupt groß genug 
sind, dass man sagen kann, dass sie nicht nur zufällig von 0 abwei- 
chen. In diesem Fall ist - in der Test - Terminologie gesprochen - 
zu testen, ob die Parameter signifikant von 0 verschieden sind, zu 
einem bestimmten Niveau a. 



9.4 Die Berechnung von Konfidenzintervallen für Anteilswerte 

Als weiteres Beispiel soll ein Konfidenzintervall für einen An- 
teilswert x berechnet werden. Anteile können, wie in Kap. 7.6 
dargestellt wurde, mit Hilfe der Binomialverteilung eingeschätzt 
werden. In der ALLBUS- Stichprobe von 1994 kann man diejeni- 
gen auszählen, die auf der Links-Rechts-Skala 9 oder 10 ange- 
kreuzt haben. Sie sollen hier verkürzt als „Extrem Rechte“ be- 
zeichnet werden. Es sind genau k = 39+41 = 80 Personen, das ist 
ein Anteil von k/n = x = 80/3380 = 2,37 % in der Stichprobe. 

Frage: Wie groß ist der Anteil der „Extrem Rechten“ in der 
Grundgesamtheit aller Deutschen (mit 95% Sicherheit)? 

Sei 7t der wahre Anteil „extrem rechter“ Personen. Die Anzahl k in 
der Stichprobe ist dann binomialverteilt, mit den zwei Parametern 
der Stichprobengröße 3380 und des wahren Anteils, also k ~ 
B(3380; 7t). Das Konfidenzintervall müsste dann über diese Bino- 
mialverteilung berechnet werden. Da hier die Bedingungen erfüllt 
sind (3380 • 0,0237 >5), benutzt man die Approximation von 
Moivre-Laplace: 
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k ~ B( n, 71) = N (n7t , Vn7t (l-7t) ) = N (338071, V33807I (1 -7t) ). 

Dann ist der Anteil x = k/n verteilt nach N (7t, Vn; (l-7t)/n) 

(Um von der Verteilung von k, den absoluten Zahlen, auf die Ver- 
teilung von x, dem Anteil, zu kommen, werden Erwartungswert 
und Standardabweichung ebenfalls durch n geteilt - das ist ein 
Resultat des Rechnens mit Erwartungswerten. S.a. den Satz v. 

LaPlace in Kap. 7.7). 

Der standardisierte Anteil x st = (x - 7t) / V 7t (l-7t)/n ist dann 
N(0,l)-verteilt. D.h. mit 95% Sicherheit liegt diese Größe zwi- 
schen -1,96 und 1,96: 

P (-1,96 <(x-7t)/V7t(l - 7t)/n < 1,96) = 0,95 

Mit den entsprechenden Umformungen (wie oben in Kapitel 9.2) 
erhält man die folgenden Grenzen für den wahren Anteil 7t: 

P (-1,96 V 7t (l-7t)/n + x < 7t < x + 1,96- V 7t (l-7t)/n) = 0,95 

Wie schon bei der Mittelwertschätzung, muss auch hier die Vari- 
anz der approximierenden Normal Verteilung mit Hilfe von Para- 
metern der Stichprobe geschätzt werden. Hier wird in der Formal 
für die Standardabweichung als Schätzer für den wahren Anteil 7t 
der Anteil x in der Stichprobe eingesetzt. Dass dieser Schätzer 
wiederum - wie bei der Mittelwertberechnung die Standardabwei- 
chung der Stichprobe - ein „optimaler“ Schätzer für die unbekann- 
te Standardabweichung ist, ist ein Ergebnis statistischer Theorie 
(Beweis: Eckey u.a. 2000:471). Dann folgt 

P(-l,96- V x(l-x)/n + x< 7t < x + 1,96- V x (l-x)/n) = 0,95 

Für x = 0,0237 erhält man das folgende 95%-Konfidenzintervall 
für 7t: 



[ -1,96- V 0,0237-0,9763/3380 +0,0237; 

0,0237 + 1,96- V 0,0237-0,9763/3380] 
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= [ -0,005+ 0,0237; 0,0237 + 0,005] 

Der ermittelte Wert von 0,0237 = 2,37% kann also bei einem 5% - 
Fehler-Niveau nur bis auf ± 0,005 = ± 0,5% genau angegeben 
werden. 0,5% sind aber bei 3380 Personen ca. 17 Personen, d.h. 
das 95% - Konfidenzintervall der absoluten Zahlen in der Stich- 
probe ist [63; 97] Personen, und mit 95% Wahrscheinlichkeit kann 
man nur sagen, dass zwischen 1,82 % und 2,82 % aller in Deutsch- 
land lebenden Personen sich auf dieser Skala als extrem rechts 
eingestuft haben. 

In diesem Fall wurde die Varianz der approximierenden Nor- 
malverteilung mit Hilfe der Anteilswerte in der Stichprobe ge- 
schätzt. Dadurch gibt es gewisse Verzerrungen, die mit Hilfe wei- 
terer und anderer Verteilungen bzw. Formeln noch verbessert 
werden können, die man in Büchern finden kann. Das gilt insbe- 
sondere, wenn nicht die Bedingungen des Satzes von Laplace 
vorliegen, also vor allem dann, wenn die Stichprobe klein ist oder 
wenn die Anteile klein sind im Verhältnis zur Stichprobengröße. 



9.5. Berechnung der nötigen Sample-Größe 

Oft besteht das Problem, dass man sich überlegen muss, wie groß 
eigentlich die Stichprobe sein sollte. Aus dem Obigen ist klar, dass 
sie umso größer sein muss, je genauer die Ergebnisse sein sollen. 

Es sei angenommen, dass der Anteil einer Bevölkerungsgrup- 
pe mit einem bestimmten Merkmal ermittelt werden soll. Die Auf- 
gabe sei z.B., die Anzahl der „Extrem Rechten“, d.h. derer, die 9 
oder 10 ankreuzen, in einer Region genau zu schätzen. Man muss 
dazu zunächst die ungefähre Größe dieser Gruppe, etwa aus der 
ALLBUS-Schätzung oder anderen Untersuchungen, wissen; sie sei 
z.B. ca. 3%. Wie aus dem bisherigen hervorgeht, muss statistisch 
dann die Frage genauer gestellt werden: mit welchem Wahrschein- 
lichkeitsniveau, d.h. welcher Sicherheit a, sollen die Ergebnisse 
festgestellt werden, und wie groß soll der Toleranzbereich sein der 
Antwort sein, d.h. auf wie viel % genau soll die Anteilszahl sein? 
Diese Angaben seien wie folgt 
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Nötige Angaben: Anteil „Rechter“ ca. 3%, 95% Sicherheit der 
Aussage, das Ergebnis soll auf ±0.5% genau sein. 

Frage: Wie groß muss die Stichprobengröße n sein? 

Die Anzahl „Rechter“ ist binomialverteilt, und diese Binomialver- 
teilung kann approximiert werden durch eine Normal Verteilung um 
den wahren, unbekannten und zu schätz enden Anteil 7t. Diese 
Normalverteilung ist dann N (7t, V(7t (l-7t)/n)). Daraus ergibt sich 
das Konfidenzintervall um den gesuchten Anteil 7t für das Niveau 
a = 0,05 wie oben: 



[ -1,96 -V 7t (l-7t)/n + 7t, 7t + 1,96-V 7t (l-7t)/n ] 

Die Länge dieses Intervalls ist 2 • 1,96 • V 7t (l-7t)/n. Das ange- 
strebte Ergebnis schreibt nun vor, dass diese Länge gleich ± 0,5% 
= ± 0,005, d.h. insgesamt 0,01 sein soll. Damit gilt 

3,92 -V 7t(l-7t)/n = 0,01 

Aus dieser Gleichung kann man n, die nötige Stichprobengröße, 
isolieren: 



392 -V 7t (l-7t)/n = 1 
153664 • 7t(l-7t)/n= 1 
153664 • 7t (l-7t) = n 

Hier geht nun noch die vorab angestellte Schätzung von 7t, dem 
tatsächlichen erwarteten Anteil ein. Sie betrug hier 3%, d.h. 7t = 
0,03. Damit geht die Gleichung weiter: 

n = 153664 • 0,03 • 0,97 = 4472 

Antwort also: Für die gewünschte Genauigkeit müssten etwa 4500 
Personen mindestens befragt werden. 




9.6 Exkurs: 

Schätzung des Konfidenzintervall für eine Varianz 
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Als weiteres Beispiel für ein Konfidenzintervall soll die unbe- 
kannte Varianz o 2 einer Grundgesamtheit aus der Varianz s 2 der 
Stichprobe geschätzt werden. Weiter oben wurde festgestellt, 
dass die Stichprobenverteilung der Varianz einer % 2 - Verteilung 
folgt: 

s 2 ~ (o 2 /(n-l)) x 2 „-i 

Das Konfidenzintervall um a 2 hat die Form [f,, y2 ; f 1 - 0 / 2 ]- wobei f 
hier mit % 2 zusammenhängt. Um diesen Zusammenhang zu 
bestimmen, geht man genauso vor wie bei der obigen Berech- 
nung für den normalverteilten Mittelwert. Weil s 2 wie angege- 
ben verteilt ist, sind die Grenzen, in denen sich s 2 mit 95% 
Wahrscheinlichkeit (a = 0,05) befindet, wie folgt: 

P(a 2 /(n-l)) % 2 n . UaJ2 < s 2 < o 2 /(n-l) ) Tn-iu-aß) = 1 - a. 

Man bildet den Kehrwert aller Terme; dadurch kehren sich die 
ngleichheitszeichen um: 

P((n-1)/ (g 2 -fn-wz) > 1/s 2 > (n-l)/(o 2 1 - 0 / 2 )) = 1 - 

Man multipliziert alle Seiten mit o 2 : 

P((n-l)/Z 2 n-i;o /2 > G 2 /s 2 > (n-l)/% 2 n . 1; 1 . 0 / 2 ) = 1 - a. 

Man multipliziert alle Seiten mit s 2 : 

P(s 2 (n-l)/x 2 n . 1;a/2 > o 2 > s 2 (n-l)/% 2 n . 1 . 1 . a/2 ) = 1 - a. 

Man vertauscht noch die rechte und linke Seite, um die ge- 
wohnten Ungleichheitsrelationen wieder zu erhalten: 
P(s 2 (n-l)/% 2 n . 1: i-o /2 < o 2 < s 2 (n-l)/% 2 n . 1 . a/2 ) = 1 - a. 

So steht wieder der unbekannte und gesuchte Parameter der 
Grundgesamtheit, die Varianz o 2 , in der Mitte. Damit erhält 
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man als Konfidenzintervall zum Niveau a für die wahre Vari- 
anz 

[S 2 (n-l)/% 2 n-l; 1-0/2; S 2 (n-l)/X 2 n-l;o /2 ] 

Aus den ALLBUS-Daten ergibt sich die Varianz der Stichprobe 
im Fall des Merkmals der Links-Rechts-Skala zu s 2 = 2.778. Da 
die x 2 - Verteilung mit der Stichprobengröße n selbst immer grö- 
ßer wird und sich der Normal Verteilung annähert, ist sie in den 
meisten Tabellen nur für kleinere Werte tabelliert; es wird da- 
von ausgegangen, dass man für größere Fallzahlen die obige 
(Kapitel 7.6) Approximation durch die Normal Verteilung be- 
nutzt. Es sei deshalb hier zunächst angenommen, dass die 
Stichprobe nur 201 Befragte enthalte. Dann ergibt sich folgen- 
des Konfidenzintervall zum Niveau a = 0,05: 

[200 • 2,778 /x 2 2 oo ; o, 97 5 ; 200 • 2,778/ % 2 2 oo;o.o 2 5 ] 

= [555,6/241,1; 555,6/162,7] 

= [2,304; 3,41] 

(Ablesen der - Werte in einer Tabelle, z.B. in Clauß 
u.a.:389). 

Man sieht, dass sich hier ein nicht - symmetrisches Intervall 
ergibt - der empirische Wert von 2,778 liegt nicht in der Mitte 
des Intervalls -, was daher kommt, dass die Varianz durch die 
Null nach links beschränkt ist, weil sie immer positiv ist. So 
wird das Intervall, obwohl es dieselbe Wahrscheinlichkeit, klei- 
ner oder größer als der ermittelte Wert zu sein, angibt, nach 
links kleiner sein müssen. 

Mit der Approximation der % 2 -Verteilung durch die Normal- 
verteilung (Kapitel 7.6)kann ein solches Konfidenzintervall 
auch über die Normal Verteilung ausgerechnet werden. Oben 
wurde angegeben, dass, wenn k ein % 2 -verteilter Parameter einer 
Stichprobe mit n > 30 ist, der transformierte Parameter 

ktrans = V2k - V 2f — 1 » N( 0, 1) standardnormalverteilt ist. 
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Aus der Verteilung von s 2 folgt durch Umformung, dass die 
Größe s‘ 2 

s‘ 2 = s 2 • (n-1) / a 2 nach % 2 - verteilt ist. 

Wenn diese Größe mit der Formel transformiert wird, ist die 
transformierte Größe standardnormalverteilt und es besteht fol- 
gende Wahrscheinlichkeit für a = 0,05, bei f = n-1, n = 3401 
Befragte: 

P(-l,96 < - V2- 3400-1 < 1,96 ) = 0,95 

P(80,5 < fes* < 84,42 ) = 0,95 

P(80,5 < ^2s 2 (n - \)/<J 2 < 84,42 ) = 0,95 

Man quadriert alle Terme und setzt n = 3401 ein 
P(6480,25 < 2 s 2 3400 / o 2 < 7126,74 ) = 0,95 

Man dividiert durch 2-3400 = 6800 
PCO, 953 < s 2 / er < 1,048 ) = 0,95 

Man berechnet den Kehrwert aller Terme, die Ungleichheitsre- 
lationen kehren sich um 
PC 1,049 > g 2 / s 2 > 0,954 ) = 0,95 

Man multipliziert mit s 2 = 2,778 
P(2,91 >o 2 > 2,65) = 0,95 

Damit ist das 95% -Konfidenzintervall der Varianz, geschätzt 
durch die Approximation der % 2 - Verteilung durch die Nor- 
malverteilung: 



[2,65; 2,91] 
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Das ist nun natürlich ein symmetrisches um s 2 = 2,778 hegen- 
des Intervall, da hier durch die symmetrische Normal Verteilung 
approximiert wurde, und ein viel kleineres, da jetzt die tatsäch- 
lichen 3401 Fälle berücksichtigt wurden und nicht nur 201 
hypothetische wie oben bei der Schätzung über die % 2 - 
Verteilung. 



Weitere Literatur zu diesem Kapitel: Hochstädter: 531-544, 555- 
556, 559-562, Mohr, Kühnel/Krebs: 237-250 



Übungsaufgaben : 

1. In der repräsentativen ALLBUS-Umfrage wurde die Frage ge- 
stellt, wie groß das Vertrauen in die Arbeitsämter sei. Es konnte 
als Antwort eine Zahl zwischen 1 (überhaupt kein Vertrauen) und 

7 (sehr großes Vertrauen) angekreuzt werden. Für die Befragten 
aus den alten und neuen BL gibt es folgende Ergebnisse: 

Alte Bundesländer: 2284 Befragte, Mittelwert 3,92, Standardab- 
weichung 1,467. 

Neue Bundesländer: 1081 Befragte, Mittelwert 3,35, Standardab- 
weichung 1,512. 

Berechnen Sie das 95%-Konfidenzintervall für die Mittelwerte der 
beiden Ländergruppen. Unterscheiden sich in der Grundgesamtheit 
ganz Deutschland die beiden Ländergruppen? 

2. In der Shell-Jugendstudie von 1997 wurde der Zukunftspessi- 
mismus von 2102 befragten Jugendlichen mit einer metrischen 
Variable mit Werten von 8 = „sehr pessimistisch“ bis 25 = „sehr 
optimistisch“ erhoben. Fasst man die Jugendlichen mit Werten von 

8 bis 17 als die „pessimistischen Jugendlichen“ zusammen, so 
haben diese in der Untersuchung einen Anteil von 4,8%. Berech- 
nen Sie aus den Daten das 95%-Konfidenzintervall für diesen 
Anteil. 




Kapitel 10: Nominalskalierte Zusammenhangsmaße 



10.1 Die Berechnung von Zusammenhangsmaßen 

Bisher wurden im wesentlichen zwei Themen behandelt: Es wur- 
den 1 . die Parameter eines einzigen Merkmals, also einer univaria- 
ten Verteilung, berechnet, und 2. statistische Modelle berechnet, 
mit denen man abschätzen kann, wie genau eine Verallgemeine- 
rung ist, die diese an einer Stichprobe gewonnenen Parameter auf 
eine Population insgesamt überträgt. Im Folgenden wird der Zu- 
sammenhang zwischen zwei Merkmalen Thema sein. Ein Zusam- 
menhang zwischen sozialen Merkmalen zu entdecken ist der bei 
weitem häufigste Grund, aus dem Daten erhoben und statistische 
Verfahren auf sie angewendet werden. Empirische Untersuchun- 
gen möchten oft nicht nur feststellen, wie verbreitet ein bestimm- 
tes Merkmal ist, sondern vor allem, welche Ursachen für seine 
Verbreitung sorgen. Als Beispiele seien genannt eine Untersu- 
chung über Langzeitarbeitslose, die feststellen will, welche Bevöl- 
kerungsgruppen vor allem von Langzeitarbeitslosigkeit betroffen 
sind, oder eine Untersuchung über Rechtsextremismus, die fest- 
stellen will, welche persönlichen und sozialen Umstände dazu 
führen, dass ein Mensch Rechtsextremist wird. 

Die Aussagen darüber, ob zwei Merkmale Zusammenhängen, 
werden, wie bei einem einzigen Merkmal, aus Parametern abgelei- 
tet, die aus der bivariaten Verteilung von zwei Merkmalen berech- 
net werden. Solche Parameter heißen Zusammenhangsmaße. Vor- 
ne (Kap. 4.5, 4.6) wurden bivariate Verteilungen als Kreuztabellen 
und Streudiagramme eingeführt, ebenso schon Parameter zur Mes- 
sung des Zusammenhangs in einem Streudiagramms, die Kovari- 
anz (Kap. 6.6), und in einer Kreuztabelle, die Prozentsatzdifferenz 
(Kap. 6. 7). Die nächsten drei Kapitel führen weitere Parameter 
bivariater Verteilungen ein. 
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Die Parameter bivariater Verteilungen unterscheiden sich, 
genauso wie die Parameter univariater Verteilungen, je nach Ska- 
lenniveau. So sind Parameter nominalskalierter bivariater Daten 
Werte, die eine komplette Kreuztabelle kennzeichnen, dagegen 
Parameter metrisch skalierter bivariater Daten Werte, die ein 
Streudiagramm kennzeichnen. 

Genau wie bei den univariaten Verteilungen stellt sich auch 
bei den Parametern für einen Zusammenhang zunächst die Frage, 
wie groß sie sind. Die Größe eines Zusammenhangsmaßes gibt 
dann an, wie viel Zusammenhang vorhanden ist, beantwortet also 
die Fragen 

- Wie stark ist der Zusammenhang? 

- Und bei mindestens ordinalskalierten Daten: welche Richtung 
hat er? 

Als zweites stellt sich die Frage, inwieweit dieser Zusammenhang 
signifikant ist und sich nicht nur aus der Zufallsauswahl der Stich- 
probe ergibt, sondern auf die Grundgesamtheit übertragbar ist: 

- Gibt es überhaupt einen Zusammenhang, ist er „signifikant“, 
und wenn ja, zu welchem (Wahrscheinlichkeits-) Niveau? 



Tabelle 10.1: Parameter und Fragestellung der zugehörigen sta- 
tistischen Analyse 





Deskriptive Statistik, 
Parameter von Ver- 
teilungen 


Inferenzstatistik, 
Statistische Modelle 


Univari- 
ate Ver- 
teilun- 
gen 


Lage- und Streu- 
ungsmaße: 
ihre Größe 


Konfidenzintervalle der Maße: 
Genauigkeit ihrer Übertragbar- 
keit auf die Population 


Bivaria- 
te Ver- 
teilun- 
gen 


Zusammenhangs- 

maße: 

Stärke und Richtung 
des Zusammenhangs 


Konfidenzintervalle der Maße: 
Test, ob der Zusammenhang 
auch in der Population besteht 
bzw. signifikant ist 
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Im Unterschied zum Induktionsschluss bei nur einem Merkmal, 
der die Genauigkeit der Übertragung der Parameter auf die Popula- 
tion feststellt, lässt sich über das Konfidenzintervall der Zusam- 
menhangsmaße zusätzlich prüfen, ob die zwei Merkmale über- 
haupt Zusammenhängen und nicht voneinander unabhängig sind. 

Für diese Prüfung ist keine repräsentative Stichprobe nötig. 
Die Ursachen, die jede befragte Person eine bestimmte Antwort 
auf eine einzelne Frage geben lassen, etwa, ob die hier lebenden 
Ausländer sich anpassen müssten, können in allen möglichen per- 
sönlichen Merkmalen liegen; die Beantwortung ist also abhängig 
von der Repräsentativität der Stichprobe und ihrer Größe. Wenn 
jedoch nur der Zusammenhang zwischen zwei Merkmalen interes- 
siert, etwa zwischen Geschlecht und den Ergebnissen bei einer 
Statistik-Klausur, so gibt es nur noch eine zu untersuchende Ursa- 
che, nämlich - in diesem Beispiel - das Geschlecht. Deshalb muss 
die Stichprobe auch nur in Bezug auf diese beiden Merkmale re- 
präsentativ sein, d.h. man kann sich bestimmte Personen heraussu- 
chen, die in ihrer Gesamtheit nur in etwa der bivariaten Verteilung 
der beiden interessierenden Merkmale entsprechen müssen. Für 
das Beispiel braucht man in der Stichprobe nur zu gewährleisten, 
dass dieselbe Statistik-Klausur von gleichviel Studenten und Stu- 
dentinnen geschrieben wird, die dieselbe Statistik - Vorlesung 
besucht haben. Wenn man dann feststellt, dass sich die Noten 
unterscheiden, hat sich erwiesen, dass das Geschlecht die Noten 
beeinflusst, unabhängig davon, in wie weit dieses Ergebnis für 
andere Zeiten und Orte gültig ist. Für die Prüfung von Zusammen- 
hangs-Hypothesen ist deshalb die oft schwierig herzustellende 
Repräsentativität von Stichproben nur dann nötig, wenn die Er- 
gebnisse auf beliebige Populationen verallgemeinert werden sol- 
len. 

Ein Zusammenhang zwischen zwei Merkmalen ist vor allem 
dann interessant, wenn das eine Merkmal als Ursache, das andere 
als Wirkung gedeutet werden kann, also die Ausprägungen des 
einen Merkmals auf die Ausprägungen des anderen Merkmals 
wirken. Die Variable, die die Ursache darstellt, wird als unabhän- 
gige Variable bezeichnet, diejenige, die die Wirkung erfährt, heißt 
abhängige Variable. In welcher Weise, d.h. mit welchem Mecha- 
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nismus, diese Wirkung zustande kommt, darüber kann die statisti- 
sche Feststellung eines Zusammenhangs überhaupt nichts aussa- 
gen. Die Statistik ist nur mit den Auswirkungen der Zusammen- 
hänge konfrontiert, wie sie sich in den Daten zeigen. 

Als ein Beispiel für einen Zusammenhang dienen hier die 
Tabellen zu Fernsehsendungen und Geschlecht aus Kap. 6.7 (Tab 
6.6). Bei welcher Tafel kann man einen Zusammenhang feststel- 
len? Offenbar werden Nachrichtensendungen etwa gleich gern 
gesehen von Frauen und Männern, während bei Sportsendungen 
eindeutig die Männer ihre Präferenzen haben. Die bedingte Vertei- 
lung von Frauen und Männern für jeweils die beiden Gruppen der 
„Gern-“ und „Nichtgern-Seher“ ist in etwa gleich bei Nachrichten, 
aber genau umgekehrt bei Sport. Das führt zu der folgenden Defi- 
nition: 



Definition : Ein statistischer Zusammenhang von zwei Variab- 
len liegt vor, wenn sich die bedingten Verteilungen der einen 
Variable für verschiedene Werte der anderen Variablen unter- 
scheiden. Das Gegenteil heißt statistische Unabhängigkeit. 



Wie diese Definition von Unabhängigkeit mit der aus der Wahr- 
scheinlichkeitstheorie bekannten Definition der stochastischen 
Unabhängigkeit zweier Ereignisse zusammenhängt, wird im Wei- 
teren geklärt werden. 

Um die Einwirkungen der Verteilung der einen Variablen auf 
die Verteilung der anderen Variablen in Parameter zu fassen, gibt 
es nun mehrere Möglichkeiten, die alle angewendet werden und 
leider zu verschiedenen Maßen für den Zusammenhang führen. Es 
sind die in der folgenden Tabelle 10.2 dargestellten fünf Verfah- 
ren. In diesem Kapitel über Zusammenhangsmaße für nominalska- 
lierte Daten werden die Verfahren 1. und 4. angewendet. Ein Bei- 
spiel für Verfahren 2. ist die Prozentsatzdifferenz, die schon in 
Kap. 6.7 erklärt wurde. 
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Tabelle 10.2: Fünf Verfahren zur Feststellung von statistischem 

Zusammenhang 

1. Größe der Abweichungen von der stochastischen Unabhän- 
gigkeit beider Merkmale (häufig bei Nominalskalenniveau) 

2. Größe der Unterschiede zwischen Teilgruppen (häufig bei 
N ominalskalenni veau) 

3. Zusammenfassung paarweiser Vergleiche von Fällen (häufig 
bei Ordinalskalenniveau) 

4. Ausmaß der Reduktion der Vorhersagefehler, wenn die eine 
Variable zur Vorhersage der anderen verwendet wird (Pro- 
portional Reduction of Error = PRE - Maß) (häufig bei Ordi- 
nalskalenniveau) 

5. Ausmaß, in dem Werte Veränderungen einer Variable zu Wer- 
teveränderungen bei der anderen Variable führen (vor allem 
bei metrischem Skalenniveau) 



10.2 Das Maß % 2 emp 

Eine große Gruppe von Maßen bilden diejenigen, die Verfahren 1 
anwenden. Diese Maße beruhen alle auf der yf - Verteilung, d.h. 
das statistische Modell, nach dem diese Zusammenhangsmaße in 
Stichproben verteilt sind - wie die Mittelwerte von Stichproben 
etwa nach der Normalverteilung verteilt waren - ist die y 2 - 
Verteilung. Sie heißen deshalb auch selber y 2 . also genauso wie 
die theoretische Verteilung, was missverständlich ist, weil hier 
derselbe Buchstabe für Werte aus theoretischen und empirischen 
Verteilungen benutzt wird und weil zweitens auch noch ein grie- 
chischer Buchstabe genommen wird, der eigentlich nur für theore- 
tische Verteilungen reserviert ist. Deshalb wird hier ein „empi- 
risch“ an das % 2 emp angefügt, wenn das deskriptive Zusammen- 
hangsmaß, das aus einer Stichprobe berechnet wird, gemeint ist. 

Die % 2 -Maße messen alle die Abweichung der Zelleninhalte 
von dem Zustand, wie die Zelleninhalte sein müssten, wenn die 
Merkmale unabhängig voneinander wären. Dabei benutzt man die 
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wahrscheinlichkeitstheoretische Definition der Unabhängigkeit (s. 
Kap. 8.2): Wenn zwei Merkmale unabhängig voneinander sind, 
haben die Zelleninhalte der Kreuztabelle dieser beiden Merkmale 
eine ganz bestimmte Größe. Sind die Abweichungen von diesen 
Größen so groß, dass sie nicht mehr nur durch die Zufälle bei der 
Stichprobenziehung zustande gekommen sein können, dann be- 
steht ein Zusammenhang zwischen beiden Variablen. 

Um einen % 2 ülllp - Wert zu berechnen, muss deshalb zunächst 
die Tabelle rekonstruiert werden, wie sie aussähe, wenn die 
Merkmale unabhängig wären. Die wahrscheinlichkeitstheoretische 
Definition der Unabhängigkeit bedeutet z.B.: Wenn das Ereignis 
„Frau sein“ und das Ereignis „gerne Sportsendungen sehen“ unab- 
hängig sind, dann ist die Wahrscheinlichkeit des Ereignisses „Frau 
sein und gerne Sportsendungen sehen“ gleich dem Produkt der 
beiden Einzelwahrscheinlichkeiten „Frau sein“ und „gerne 
Sportsendungen sehen“. 

Um eine allgemeine Definition geben zu können, muss zu- 
nächst eine zugrunde liegende beliebige Kreuztabelle in allgemei- 
ner Form definiert werden. Wenn eine solche Tabelle dafür be- 
nutzt wird, um den Zusammenhang zweier kategorialer Merkmale 
darzustellen, wird sie auch „Kontingenztafel“ genannt, ebenso 
steht „Kategorie“ für die Ausprägungen der Merkmale. 



Tabelle 10.3: Eine Kontingenztafel (Kreuztabelle) mit k Zeilen und 
m Spalten, sowohl mit f = absolute, als auch mit p = relative Häu- 
figkeiten möglich 



abhg. Var. 
Y 


Kateg. 

„1“: 


Kateg. 

„2“: 


- ,d“ 


Kateg. 

„m“: 


£ (= Vert. d. 
unabhängig. 


unabhg. Var. X 


yi 


y2 


y\ 


Ym 


Variablen) 


Kategorie „1“: Xj 


fn. Pu 


fl2- Pl2 


fibPii 


flm? P 1 m 


f(Xi), p(X|) 


Kategorie „2“: x 2 


f21, P21 


f 2 2, p 22 


% P2j 


P2m 


f(x 2 ), p(x 2 ) 


... „i“...: Xj 


f,|. Pil 


fi2> Pi2 


f ü> Pü 


fim’ Pim 


f(Xi), p(xO 


Kategorie „k“: x k 


fkl, Pkl 


fk2' Pk2 


fki' Pki 


fkm’ Pkm 


f(x k ), p(x k ) 


£ (= Verteilung 
der abhängigen 


f(yi). 


f(y2>. 


f(yj). 


f(yj, 


n bzw. 1.0 


Variablen) 


p(yi) 


pto) 


p(yO 


p(yj 
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Hierbei wird p,, berechnet als Anteil an der Population von insge- 
samt n. p(Xi) bzw. p(yj) stellen direkt die Wahrscheinlichkeit dar, 
die Ausprägung i des Merkmals X bzw. j des Merkmals Y zu be- 
sitzen, dar. Bei Unabhängigkeit beider Merkmale erwartet man 
gemäß ihrer Definition (s. Kap. 8.2) für jede Zelle eine Wahr- 
scheinlichkeit, die dem Produkt der jeweiligen Randhäufigkeiten 
entspricht. Also kann man folgende Definition treffen: 



Definition: Die erwartete relative (p e y) und absolute (f*y) 
Häufigkeit der Zelle (i,j) einer Kontingenztafel ist definiert 
durch 



p e ij = p(xO p(yj), 

f 6 y = P c ü n = pOi) p(yj) n = 



f ( x i ) • f (y j ) 

n 



Als Beispiel werden die erwarteten relativen und absoluten Häu- 
figkeiten der Kreuztabelle für Sportsendungen und Geschlecht aus 
der Tabelle der absoluten Häufigkeiten (Tab 6.6) berechnet: 



Sport 
sehen gern 


ja 


nein 


Summe 


Frauen 


p e „=0, 67-0,43 
= 0,29 

f u =(100-64)/150 
= 43 


p e 12 =0, 67-0,57 
= 0,38 

f 12 =(100-84)/150 
= 57 


f( Xl ) = 100 
p(*i) = 0,67 


Männer 


p e 21 =0, 33-0,43 
= 0,14 

f 6 2i=(50-64)/150 
= 21 


p e 22 =0, 33-0,57 
= 0,19 

f 22 =(50-86)/150 
= 29 


f(x 2 ) = 50 
p(x 2 ) = 0,33 


Summe 


f(yi) = 64 
p(yt) = 0,43 


f(y 2 ) = 86 
p(y 2 ) = 0,57 


150 



Das bedeutet, bei Unabhängigkeit der Sportsendungen vom Ge- 
schlecht müssten jeweils 43 Frauen und 21 Männer der Befragung 
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die Sportsendungen gern sehen und jeweils 57 Frauen und 29 
Männer sie nicht gern sehen. 

Das Zusammenhangsmaß % 2 emp misst nun jeweils die Abwei- 
chung von der Unabhängigkeit in jeder Zelle und summiert diese 
Abweichungen auf. In welcher Weise Abweichungen von einem 
Wert gemessen werden können, wurde schon bei der Herleitung 
der verschiedenen Streuungsmaße als Abweichung vom Mittelwert 
diskutiert (Kapitel 6.3). Für das Maß % 2 cmp verfährt man genauso 
wie bei der Varianz: man wählt die standardisierte quadrierte Dif- 
ferenz, für jede Zelle, Dann erhält man folgende Definition: 



Definition'. Das Zusammenhangsmaß % 2 emp (Chi-Quadrat) ist 
definiert durch 

(f - f ?) 2 

v 2 _ V Ul) 11 ' 

Aemp - e 

i=l k T ij 

j=l,...,m 



Als Beispiel die Berechnung von x 2 emp aus den Daten der beiden 
Tabellen mit absoluten (Tab 6.6) und erwarteten Häufigkeiten 
(s.o.): 

X 2 emp = (31-43) 2 / 43 + (33-21) 2 / 21 + (69-57) 2 / 57 + (17-29) 2 / 29 
= 144/43+ 144/21 + 144 /57 + 144 /29 = 3,34+6,85+2,53+4,96 
= 17,68 

Die Bezeichnung % 2 em p bedeutet also hier das Zusammenhangs- 
maß, das aus einer empirischen Kreuztabelle berechnet werden 
kann. Aber die Bezeichnung ist deshalb gut gewählt, weil die 
Prüfverteilung dieses Maßes die Form einer yj - Verteilung be- 
sitzt. Die Summe ist nämlich definiert als die Summe von normier- 
ten quadrierten Abweichungen, d.h. genauso, wie die Varianz 
definiert ist, und eine solche Summe ist y 2 - verteilt (s. Kap. 7.5). 

Was wäre der zu erwartende Wert von % 2 em p, wenn Geschlecht 
und Sportsendungen unabhängig wären? Wenn beide Variablen 
stochastisch unabhängig sind, ist das Maß in der Population 0, weil 
dann alle Differenzen in den Zählern der obigen Summe 0 sind. Es 
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wird bei empirischen Stichprobendaten dann nur so weit von 0 
abweichen, wie der Zufall eine Stichprobe produzieren kann, die 
nicht genau der Population entspricht. 

Da man die theoretische Verteilung dieses Parameters weiß, 
kann man auch ein Schwankungsintervall angeben. Mit Hilfe des 
Schwankungsintervalls kann man dann feststellen, ob die Abwei- 
chungen von den erwarteten Häufigkeiten groß genug sind, um mit 
einer vorgegebenen Wahrscheinlichkeit nicht zufällig zu sein. 
Wenn das der Fall ist, sind die beiden Merkmale auch in der Popu- 
lation insgesamt nicht unabhängig. Um z.B. die Frage zu entschei- 
den, ob ein Zusammenhang zwischen Geschlecht und der Vorliebe 
für Sportsendungen besteht, muss nachgesehen werden, ob der 
empirische % 2 cmp - Wert tatsächlich groß genug ist, um nicht nur 
zufällig auf Grund der Stichprobenziehung von den bei Unabhän- 
gigkeit erwarteten Werten abzuweichen. Bei der Prüfung auf Un- 
abhängigkeit handelt es sich also um einen Test, ob x 2 cmp nicht nur 
zufällig von 0 verschieden ist (s. Kap. 9.3). Um den Test durchzu- 
führen, muss der empirische Wert mit demjenigen theoretischen % 2 
- Wert der Tabelle verglichen werden, den ein durch das Fehlerni- 
veau a bestimmter Prozentsatz von Stichproben auch dann er- 
reicht, wenn in der Population kein Zusammenhang besteht. 

Dazu muss aber die theoretische % 2 -Verteilung genauer be- 
stimmt werden. D.h., es müssen die Freiheitsgrade f derjenigen % 2 f 
-Verteilung angegeben werden, die zu einer speziellen Kreuztabel- 
le gehört. Freiheitsgrade bedeuten die Anzahl der unabhängigen 
Summanden, die in die Summe, mit der % 2 berechnet wird, einge- 
hen. Wie viele der vier Summanden, die aus den vier Feldern der 
Tabelle gebildet werden konnten, sind nun unabhängig voneinan- 
der? Es stellt sich heraus, dass man in einer Vierfelder-Tabelle nur 
eine einzige Zelle frei wählen kann. Denn durch die bestehenden 
festgelegten Randverteilungen sind bei der Wahl der Häufigkeit in 
einer Zelle sofort die Werte der anderen Zellen festgelegt. 

Das bedeutet, von den vier Summanden, die in die Summe für 
die Berechnung von % 2 emp für eine Vierfeldertafel eingehen, kann 
tatsächlich nur einer frei variieren, d.h. die Verteilung hat nur 
einen Freiheitsgrad. Und das gilt ähnlich auch für größere Tabel- 
len. 
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Definition : Sei % 2 emp berechnet aus einer Kreuztabelle mit k Zei- 
len und m Spalten. Dann ist es % 2 r - verteilt mit f = (k- 1 )(m- 1 ) 
Freiheitsgraden (auch df = degrees of freedom): 

2 2 

X emp ~ X (k-l)(m-l) 



Die Freiheitsgrade der theoretischen % 2 - Verteilung für die obige 
Vierfeldertafel sind f = (2- 1 )(2- 1 ) = 1. Für den Test des x 2 emp - 
Werts der Sportsendungs-Tabelle muss man deshalb in der Tabelle 
dieser ~/ 2 1 ~ Verteilung nachsehen, wie groß der entsprechende 
Wert ist, bis zu dem z.B. 95% (bei einem Fehler - Niveau von a = 
5%) aller Werte liegen, wenn die Abweichungen zufällig sind. In 
der Tabelle (s. Kap. 7.5) ergibt sich 

% 2 1;0.05 = 3,84 < 17,68 = X“ e mp 



Das empirische %” e m P = 17,68 ist größer als das theoretische % 2 i;o.o5 
= 3,84. Das bedeutet, die empirisch festgestellten Abweichungs- 
quadrate sind so groß, dass sie weit über die Grenze fallen, die 
95% aller Stichproben durch zufällig entstehende Abweichungs- 
quadrate produzieren. Wenn die Sportsendungs-Kreuztabelle zu- 
fällig zustande gekommen wäre, würde sie zu den 5% Tabellen 
gehören, die durch zufällige Abweichungen über dieser Grenze 
liegen. Im Umkehrschluss ergibt sich, dass die Abweichungen der 
obigen Tabelle von der Unabhängigkeit mit 95% Wahrscheinlich- 
keit nicht zufällig sind. D.h. sie sind signifikant zum Niveau 0,05. 
Sie sind sogar signifikant zum Niveau 0,001, denn x 2 ]; 0 .ooi = 10,8, 
d.h. sie sind sogar mit 99,9% Sicherheit nicht zufällig. 

Damit ist zunächst die Frage statistisch einwandfrei geklärt, 
dass es einen Zusammenhang zwischen Sportsendungen und über- 
wiegend männlicher Fernsehbeteiligung gibt, also die zweite der 
oben formulierten Fragen an Zusammenhangsmaße beantwortet. 

Zu beantworten bleibt die erste Frage nach der Stärke des 
Zusammenhangs. Und hier ist % 2 emp ein schlechtes Maß. Denn es 
bleibt nicht gleich groß, wenn alle Zahlen der Tabelle mit demsel- 
ben Faktor multipliziert werden. Man kann also nur die % emp - 
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Werte von genau gleich langen Datensätzen miteinander verglei- 
chen. 



10.3 Auf 5C”emp - basierende Maße 

Um diesem Problem abzuhelfen, sind verschiedene Maße vorge- 
schlagen worden, die alle auf dieselbe Standardisierung des Wer- 
tebereichs dieser Maße hinauslaufen. Dieser Standard bildet eine 
Grundlage, nach der sich ein großer Teil der Zusammenhangsma- 
ße richtet: 

Tabelle 10.4: Eigenschaften von Zusammenhangsmaßen 

Eigenschaften von vielen Zusammenhangsmaßen M für zwei 

Variablen: 

M = 0:die beiden Variablen sind stochastisch unabhängig. 

Es ist mit einem Test oder dem Konfidenzintervall zu 
prüfen, ob ein kleines M tatsächlich signifikant von 0 
abweicht. 

M= l:die eine Variable lässt sich komplett durch die andere 
Vorhersagen. 

0 < M < 1: je größer M, desto stärker hängen die Variablen zu 
sammen. 

Bei vielen Maßen gilt für sozialwissenschaftliche Daten: 

M > 0,7: ein „sehr starker“ Zusammenhang. 

M > 0,5: ein „starker“ Zusammenhang 

M > 0,3: ein „mittlerer“ Zusammenhang. 

M < 0,3: ein „schwacher“ Zusammenhang 



Zwei beliebige soziale Merkmale hängen meist nur schwach zu- 
sammen, d.h. es gilt M < 0,3 für viele bivariate Verteilungen sozi- 
alwissenschaftlicher Daten. Das wird oft als eine Schwäche sozi- 
alwissenschaftlicher empirischer Forschung angesehen. Ist das 
eine Art „Fehler“, den sozialwissenschaftliche Daten aufweisen? 
Man kann sich umgekehrt überlegen, was es bedeuten würde, 
wenn zwei beliebige soziale Merkmale im Allgemeinen stark zu- 
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sammenhängen würden. Was wäre das für eine Gesellschaft? Dann 
könnte man aus der Kenntnis weniger Merkmale auf viele andere 
Merkmale schließen, z.B. aus einigen wenigen Anzeichen das 
Verhalten und die Ansichten eines Menschen Vorhersagen. Es 
wäre eine in großem Maße vorherbestimmte und festgelegte Ge- 
sellschaft, die sehr wenig Freiheiten und Entwicklungsmöglichkei- 
ten besäße. Deswegen sind die manchmal beklagten „schwachen“ 
Ergebnisse sozialwissenschaftlicher Empirie die Kehrseite der 
ganz und gar nicht beklagenswerten Tatsache, dass soziale Zu- 
sammenhänge nicht auf den ersten Blick durchschaubar, sondern 
multidimensional, flexibel und vielfältig sind. 

Damit das Maß X~ emp die obigen geforderten Eigenschaften 
erreicht, bieten sich mehrere Möglichkeiten an. Die erste heißt 



Definition : Der <& (Phi) - Koeffizient ist definiert durch: 



x 



emp 



V n 

<J> von einer Vierfeldertafel lässt sich leicht berechnen: 
lad - bc| 

4 > = 



yj( a + c)(b + d)(a + b)(c + d) 



Offenbar ist <E> unabhängig von der Anzahl der Fälle n. Aber für 
größere Tabellen als Vierfeldertafeln kann <f> auch größer als 1 
werden, erfüllt also nicht alle die Anforderungen an Zusammen- 
hangsmaße, die in Tabelle 10.6 formuliert worden sind. <f> wird 
deshalb hauptsächlich für Vierfeldertafeln angewandt. Maximal, 
d.h. den Wert 1, nimmt <J> in Vierfeldertafeln auch nur dann an, 
wenn die Randverteilungen von Zeilen- und Spaltenvariable 
gleichverteilt und identisch sind. Je unterschiedlicher die Randver- 
teilungen sind, desto kleiner wird das maximal mögliche <t>. Bei 
Vergleichen von Tabellen mit Hilfe des <f> - Koeffizienten sollte 
man also darauf achten, ob große Unterschiede in den Randvertei- 
lungen der Tabellen bestehen. 

Über die Definition sind der % 2 emp - Wert von Vierfeldertafeln 
und der <f>-Wert verbunden: 
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% 2 emp = n ■ <E 2 



Eine Beispiel-Berechnung wieder an der Sportsendungs-Tabelle: 

<£ = (31-17 - 69-33)/ Vl00-50-64-86 = 0,33 

Was besagt nun ein <J> von 0,33? Wenn <J> in dieser Tabelle maxi- 
mal 1 werden könnte, dann könnte man sagen, dass 33% der Ab- 
weichungen von der Unabhängigkeit, gemessen als quadrierte 
Differenzen, beim Interesse an Sportsendungen vom Geschlecht 
erklärt werden können. Da <J> aber wegen der Unterschiedlichkeit 
der Randverteilungen nicht ganz 1 werden kann, sind es tatsäch- 
lich etwas mehr als 33%. 

Das Problem, für größere Tabellen auch größer als 1 werden 
zu können, vermeidet eine weitere Umformung von % e mp: 




Offensichtlich ist C immer kleiner als 1, erfüllt also auch wieder 
nicht genau die Anforderungen. In einer Vierfeldertafel ist z.B. das 
maximal mögliche C max = 0,707. Am Beispiel der obigen Tabelle: 

C = ^17,68/(150 + 17,68) = 0,32 

Der Kontingenzkoeffizient ist damit ähnlich groß wie der <E>- 
Koeffizient, aber er muss definitionsgemäß immer kleiner als <f> 
sein. Er ist aber wegen seiner Definition mit % 2 emp im Nenner in 
seiner Größe nicht mehr inhaltlich, etwa als irgendwelche Abwei- 
chungen, zu interpretieren. Der maximal mögliche Wert von C 
kann nur für quadratische Tabellen genau angegeben werden. Um 
diese vielen Schwierigkeiten zu vermeiden, gibt es einen dritten 
Koeffizienten, der weiter verbreitet ist. 
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Definition: Cramer‘s Y ist definiert durch 



V = 



1 



2 

emp 



' n • min(k - 1, m - 1) 



wobei k die Zeilen- und m die Spaltenanzahl der Tabelle ist und 
„min“ von zwei Zahlen die kleinere von beiden bedeutet. 



Im Fall einer Vierfeldertafel ist offenbar V = <J>, weshalb es für das 
Beispiel nicht neu berechnet werden muss. V kann nie größer als 1 
werden, und V kann den Wert 1 auch für nicht-quadratische Tabel- 
len erreichen. Aus dem Grund entspricht V noch am ehesten den 
Anforderungen an ein Zusammenhangsmaß, die oben formuliert 
worden sind. Sowohl beim Kontingenzkoeffizient C als auch bei 
Cramers V haben die Werte keine intuitive Bedeutung mehr, man 
kann sie zwar untereinander, von Tabelle zu Tabelle, vergleichen, 
aber sie nicht mehr inhaltlich interpretieren als irgendeine graduel- 
le Abweichung. 



10.5 Maße mit PRE-Interpretation 

Ganz anders lassen sich dagegen Maße mit einer sog. PRE- 
Interpretation (PRE = „proportional reduction of error“), die auf 
der vierten Möglichkeit der Feststellung von Zusammenhang (Kap 
10.1) beruhen, interpretieren. Ein PRE-Maß wird in der Weise 
berechnet, dass man sich fragt, in wieweit man alle Fälle besser 
auf die Kategorien der abhängigen Variable verteilen kann, wenn 
man weiß, welcher Kategorie der unabhängigen Variable jeder Fall 
angehört. Es geht also darum, die Zellen einer Kreuztabelle mit 
den richtigen Personen zu besetzen, wenn man die Randverteilun- 
gen kennt. Man hat z.B. die beiden Variablen Sportsendungen und 
Geschlecht, und man weiß die Randverteilungen: 100 Frauen und 
50 Männer, und 64 sportinteressierte Personen und 86 nicht an 
Sport Interessierte. 
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Tabelle 10.5: Geschlecht und Sportsendungen (Wiederholung) 



Sport sehen gern 


ja 


nein 


Summe 


Frauen 


31 


69 


100 


Männer 


33 


17 


50 


Summe 


64 


86 


150 



Wenn man nichts über den Zusammenhang von Geschlecht und 
Sportsendungen weiß, macht man am wenigsten Fehler, wenn man 
jede Person in die Modalkategorie, die Ausprägung des Modus, 
einordnet. Man würde also, wenn man für eine konkrete Person 
Vorhersagen soll, ob sie an Sportsendungen interessiert ist oder 
nicht, Vorhersagen, dass sie nicht interessiert ist, weil die Mehr- 
zahl, nämlich 86 von 150 Personen, der befragten Gruppe auch 
nicht an Sport interessiert ist. Man würde dann einen Fehler bege- 
hen, und zwar von der Größe 64 Personen. Diese Größe des Feh- 
lers dient im Folgenden als Maßstab dafür, wie viel man den Feh- 
ler reduzieren kann, wenn die Kenntnis des Geschlechts hinzu- 
kommt. 

Vorhersage ohne Kenntnis des Geschlechts: 

Modalkategorie ist „Nicht gern Sport sehen“ => die günstigste 
Vorhersage ist: alle Personen sind „Nicht gern Sport - Seher“ => 
64 Fehler. 

Wenn man nun weiß, dass von den Männern die Mehrheit an 
Sportsendungen interessiert ist, dann wird der Fehler kleiner, wenn 
man für alle Männer vorhersagt, dass sie gerne Sportsendungen 
sehen. Die Fehler, die sich dann ergeben, sind erstens genau 17 
Männer, die so fälschlicherweise als Sportinteressierte eingeordnet 
werden, und zweitens genau 31 Frauen, die als Nicht - Sportinte- 
ressierte eingeordnet werden. Die Gesamtanzahl der Fehler, die 
man also bei Hinzunahme unserer Kenntnis der geschlechtspezifi- 
schen Verteilung des Sportinteresses begeht, ist 31 + 17 = 48. 
Vorhersage unter Berücksichtigung des Geschlechts: 

Ist die Person „Mann“ => „Sieht gern Sport“ =>17 Fehler , 
ist die Person „Frau“ => „Sieht Sport nicht gern“ =>31 Fehler; 
zusammen 48 Fehler. 
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Damit wird die Fehleranzahl relativ zu der Vorhersage ohne 
Kenntnis des Geschlechts um genau folgenden Anteil reduziert: 

(64-48) / 64 = 16 /64 = 0,25 = 25% 

Und genauso ist das Maß X (Lambda) definiert: Reduktion der 
Vorhersagefehler auf Grund der Einordnung in die häufigste, die 
modale Kategorie. Die genaue Formel, die nun auch für größere 
Tabellen gilt, ist: 



Definition: X (Lambda) ist definiert durch 
( £d a ) — D Ä 

^ _ Kat.(u) 

N-D A 

wobei D Modalwerte der Randverteilungen, d Modalwerte der 
bedingten Verteilungen, A der Index für abhängige und U der 
Index für unabhängige Variable bedeutet. 



Nach dieser Formel wird das X der Tabelle wie folgt berechnet: 

X = ((69 + 33) - 86 )/ (150 - 86) = 0,25 

Diese 0,25 können nun genau inhaltlich interpretiert werden, in der 
Weise, wie das Maß konstruiert ist: Der Zusammenhang zwischen 
Geschlecht und Interesse an Sportsendungen ist genau so stark, 
dass er die Vorhersagefehler, die man ohne Kenntnis dieses Zu- 
sammenhangs durch einfache Anwendung der Modalkategorie 
machen würde, um genau 25% reduziert. 

So schön das Maß X sich interpretieren lässt, hat es doch eini- 
ge Nachteile. Es ist zunächst asymmetrisch. Wenn mit dieser Ta- 
belle nicht die Sportsendungsbeteiligung durch das Geschlecht, 
sondern die Geschlechtszusammensetzung vor einer Leinwand, auf 
der eine Sportsendung läuft, vorhergesagt werden soll, erhält man 
ein anderes X, nämlich: 



X = ((33 + 69) - 100) / (150 - 100) = 2/50 
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Die Rolle von abhängiger und unabhängiger Variabel ist dann 
vertauscht. Man sagt zunächst auf Grund der Daten voraus, dass 
alle Personen vor der Leinwand Frauen sein werden, da die Frauen 
in diesem Datensatz in der Mehrheit sind. Dabei macht man 50 
Fehler, die Männer sind in diesem Fall der Fehler. Dann sagt man 
aber nach Sportinteresse differenziert voraus und macht dabei bei 
den Sportinteressierten genau 31 und bei den Nicht- 
Sportinteressierten genau 17 Fehler, also zusammen 48 Fehler. 
Das ist genau nur eine Reduktion um 2/50. 

Ein weiterer Nachteil von X ist, dass es den Wert 0 annehmen 
kann, obwohl alle anderen Maße ~/\ C, V nicht 0 sind und ganz 
offenbar beide Variablen nicht unabhängig sind. Wenn z.B. die 
folgende Änderung in der Tabelle geschieht: 



Sport sehen gern 


ja 


nein 


Summe 


Frauen 


30 


70 


100 


Männer 


25 


25 


50 


Summe 


55 


95 


150 



dann ergibt sich X = ((70 + 25) - 95)/55 = 0/55 = 0, obwohl offen- 
bar keine Unabhängigkeit beider Variabler gegeben ist. Gute Vor- 
aussetzung für ein interpretierbares X ist deshalb wiederum dann 
gegeben, wenn die Randverteilungen nicht zu ungleichmäßig und 
nicht zu sehr von einer einzigen Kategorie dominiert sind. 

Ein verbessertes PRE-Maß, das diese Fehler von X nicht be- 
sitzt, ist das folgende: 



Definition : Goodman und Kruskals x (tau) misst den Zusam- 
menhang zweier kategorialer Variabler als Vorhersage- 
Verbesserung relativ zu einer Zufallsverteilung der Personen 
auf Basis der Randverteilungen. 



Es ist kompliziert zu kalkulieren, so dass seine Berechnung lieber 
Computern überlassen wird (für eine genaue Beschreibung des 
Vorgehens s. Blalock 1979:307-310). Was x von X unterscheidet, 
ist, dass die Fehlerreduktion nicht gemessen wird in Bezug auf 
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eine Vorhersage über den Modal wert der abhängigen Variable, 
sondern in Bezug auf eine zufällige Zuordnung aller Fälle nach der 
vorgegebenen Rand Verteilung der abhängigen Variable, x wird 
damit genau dann 0, wenn die Variablen wirklich unabhängig sind. 
Der x - Wert hat aber eine gute inhaltliche Interpretation: Ein x 
von 0,33 bedeutet, dass 33% mehr Personen richtig vorhergesagt 
werden, wenn man das Interesse an Sportsendungen für eine Per- 
son nicht nur nach der allgemeinen Verteilung des Sportinteresses, 
sondern nach der nach Geschlecht unterschiedenen bedingten 
Verteilung des Sportinteresses vorhersagt. 

Als Beziehung zwischen den Variablen gilt für Vierfelderta- 
feln: 

<b = V = V x, 

d.h. x < <J> und x < V (da alle Werte zwischen 0 und 1 liegen). 

Da auf diese Weise <f> und V mit x verbunden sind, gilt für ihre 
Werte bei Vierfeldertafeln die entsprechende Interpretation: ihr 
Quadrat ist das Ausmaß der Vorhersage-Reduktion. 

Nicht nur in der Literatur kommen alle Maße vor, sondern in 
empirischen Untersuchungen werden sie auch tatsächlich neben- 
einander verwendet. SPSS gibt alle diese Maße für nominalskalier- 
te Daten aus. Der SPSS-Ausdruck ist in Tabelle 10.6 zu sehen. 

Beim Maß yj wurde oben berechnet, ob die empirisch berech- 
nete % 2 emp - Summe von Abstandsquadraten groß genug war, um 
mit mehr als 95% Wahrscheinlichkeit nicht zufällig zu sein. Damit 
wurde getestet, ob der % 2 L . inp -Wert auch in der Grundgesamtheit 
tatsächlich signifikant größer als 0 ist, weil man erst dann anneh- 
men kann, dass die beiden Variablen tatsächlich abhängig sind. In 
der Spalte „Asymptotische Signifikanz“ der SPSS-Ausgabe ist das 
a- Niveau angegeben, zu dem der % 2 e mp -Wert gerade noch signi- 
fikant ist. Für ein Niveau von 5% würde an dieser Stelle 0,05 ste- 
hen. Dieses Niveau ist hier offenbar kleiner als 0,000 und damit ist 
XVmp hochsignifikant zu einem Niveau kleiner als 0,1%. 
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Tabelle 10.6: SPSS-Ausgabe nominalskalierter Zusammenhangs- 
maße 



Chi-Quadrat-Tests 





Wert 


df 


Asymptotisch 
e Signifikanz 
(2-seitig) 


Chi-Quadrat nach 
Pearson 

Anzahl der gültigen Fälle 


16,692 

150 


1 


,000 



Richtungsmaße 







Wert 


Asymptoti 

scher 

Standardf 

ehler 


Näherung 
sweises T 


Näherung 

sweise 

Signifikanz 


Nominal- bzgl. Lambda 






,110 


1,350 




Nominalmaß 


Sport sehen abhängic 




,096 


2,302 


,021 




Geschlecht abhängig 




,157 


,250 




Goodman- 


Sport sehen abhängic 


,111 


,052 




,000 


al-Tau 


Geschlecht abhängig 


,111 


,052 




,000 



Symmetrische Maße 





Wert 


Näherung 

sweise 

Signifikanz 


Nominal- bzgl. 


Phi 


,334 




Nominalmaß 


Cramer-V 


,334 


,000 




Kontingenzkoeffizient 


,316 


,000 


Anzahl der gültigen Fälle 









In ganz analoger Weise kann man, allerdings auf eher schwierig zu 
berechnenden theoretischen Verteilungen beruhend, auch für alle 
anderen Maße angeben, ob sie signifikant von 0 verschieden sind, 
also eine Abhängigkeit anzeigen. Das geschieht jeweils in der 
Spalte „Näherungsweise Signifikanz“. Und in derselben Weise, 
wie das Konfidenzintervall für Mittelwerte und Streuungen ange- 
geben wird, kann man auch Konfidenzintervalle für diese Maße 
angeben, wenn man die Standardfehler der Verteilungen dieser 
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Maße kennt. Auch die Standardfehler werden hier für einige Maße 
ausgegeben (Zur Berechnung von Konfidenzintervallen und zu 
„Näherungsweises T“ siehe Kap. 1 1.4). 

Die Vielfalt der möglichen Zusammenhangsmaße wird sich 
noch einmal wiederholen, wenn im nächsten Abschnitt die Maße 
für ordinalskalierte Daten behandelt werden. Erst auf metrischem 
Skalenniveau hat sich eine Vereinheitlichung auf ein allseits ak- 
zeptiertes Zusammenhangsmaß durchgesetzt. Der Unterschied der 
hier vorgestellten Maße beruht vor allem darauf, erstens nach 
welchem Konzept sie den Zusammenhang messen, nämlich a) 
Abweichung von Unabhängigkeit und b) Reduktion der Vorhersa- 
gefehler (PRE) und zweitens auf den unterschiedlichen Methoden, 
die Maße auf den Bereich zwischen 0 und 1 zu standardisieren. In 
der folgenden Tabelle 10.7 sind diese Unterschiede und die ver- 
schiedenen Vorzüge und Nachteile der Maße zusammengefasst: 



Tabelle 10.7: Übersicht über die Zusammenhangs-Maße von no- 
minalskalierten Variablen 



Maß 


Mess- 

Methode 


Nachteile 


einf. 

In- 

ter- 

pret. 


Maxi- 
mum 
ist 1 


0 bei 
Unab 
häng, 
keit 


Geeig 
net 
für k 
+ m 


~1T 


Abweich, v. 
Unabhgkeit 


wächst mit 
n 


nein 


nein 


ja 


ja 




Abweich, v. 
Unabhgkeit 


wird > 1 bei 
größer. Tab. 


nein 


nein 


ja 


nein 


C 


Abweich, v. 
Unabhgkeit 


ist immer 
kleiner als 1 


nein 


nein 


ja 


nein 


V 


Abweich.v. 

Unabhgkeit 




nein 


ja 


ja 


ja 


k 


PRE bei 
Prognose 
nach Modus 


kann 0 sein 
trotz Ab- 
hängigkeit 


Ja 


ja 


nein 


ja 


X 


PRE bei 
Prognose 
nach Rand- 
verteilung 


Berechnung 

schwer 

nachvoll- 

ziehbar 


Ja 


ja 


ja 


ja 
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Weitere Literatur zu diesem Kapitel: Clauß u.a.: 63 - 74, 216-218, 
Hochstädter 138 - 147, 649 - 652, Blalock 1979: 307 - 312, 
Kühnel/Krebs 307-365 



Übungsaufgaben : 

1. In einer repräsentativen Studie zur Ehe wurde untersucht, ob 
christliche Religiosität auf die Eheschließung Einfluss hat. Dazu 
wurden verheiratete Personen u.a. befragt, ob sie schon vor ihrer 
Ehe mit dem Partner unverheiratet zusammengelebt hätten. Es 
ergab sich die folgende Tabelle: 

Konfession * Unverheiratet zusammengelebt Kreuztabelle 



Anzahl 





Unverheiratet 

zusammengelebt 


Gesamt 


ja 


nein 


Konfession Christlich 


507 


982 


1489 


andere oder keine 


368 


334 


702 


Gesamt 


875 


1316 


2191 



Berechnen Sie <f> und % 2 emp - Stellen Sie fest, ob in der Grundge- 
samtheit tatsächlich ein Zusammenhang zwischen beiden Merkma- 
len besteht, und wenn ja, wie stark er ist. 

2. In einer Untersuchung über den Zusammenhang von Geschlecht 
und Computernutzung wurden je 50 Männern und Frauen gefragt, 
ob sie den Computer „viel“ oder „wenig“ nutzen (Grenze kann 
z.B. eine bestimmte Anzahl Stunden pro Tag sein). Es ergibt sich, 
dass 20% mehr Männer als Frauen angeben, den Computer „viel“ 
nutzen. In der Untersuchung wird fortgefahren: „... wie diese Zahl 
von 20% zeigt, ist der Computer bei Männern schon mehr in den 
Alltag eingedrungen als bei den Frauen Abgesehen von der 
Anlage der Untersuchung und der spezifischen Fragestellung, ist 
diese Behauptung in dieser Form statistisch korrekt? Was benöti- 
gen Sie aus der Sicht einer/s Statistikerin, um diese Behauptung zu 
beurteilen? 





Kapitel 11: Ordinalskalierte Zusammenhangsmaße 



11.1. Wie sollten Maße für ordinalskalierte Merkmale ausse- 
hen? 

In diesem Abschnitt geht es darum, wie der Zusammenhang zwi- 
schen zwei Merkmalen gemessen werden kann, wenn sie beide 
Ordinalskalenniveau besitzen. Die dafür geeigneten Maßzahlen 
heißen auch Rangkorrelationsmaße. 



Definition : Der Zusammenhang zwischen zwei ordinal skalier- 
ten Merkmalen wird mit Rangkorrelationsmaßen gemessen. 



Diese Maße sind deshalb wichtig für sozialwissenschaftliche Da- 
ten, weil sie dann eingesetzt werden können, wenn ordinalskalierte 
Daten ausgewertet werden sollen, also Daten, die nicht quantitativ, 
sondern nur qualitativ verglichen werden können. In den Sozial- 
wissenschaften fallen solche Daten an, weil soziale Phänomene oft 
nur sprachlich vermittelt erfasst werden können. Einige Beispiele: 
Der Inhalt von Fernsehsendungen soll daraufhin ausgewertet 
werden, wie viel Gewalt sie zeigen. 

Erzählte Lebensläufe sollen daraufhin ausgewertet werden, 
wie stark der tatsächliche Verlauf mit dem vom Befragten ge- 
schilderten Verlauf übereinstimmt. 

Verwaltungserlasse sollen daraufhin ausgewertet werden, wie 
stark sie politisch beeinflusst sind. 

Offene Interviews mit Jugendlichen sollen daraufhin ausge- 
wertet werden, wie rechts die Jugendlichen sind. 

Literarische Texte sollen daraufhin untersucht werden, wie 
romantisch sie sind. 



V. Müller-Benedict, Grundkurs Statistik in den Sozialwissenschaften, 
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In diesen Fällen ist die zu messende Stärke („wie'") i.A. kein 
Merkmal mit Intervallskalenniveau, sondern hat nur eine kleine 
Zahl von Einteilungen, die sich ordinal ordnen lassen: z.B. viel 
Gewalt, einige Gewalt, wenig Gewalt, keine Gewalt. Oder rechts- 
extreme Orientierung deutlich vorhanden, eher vorhanden, eher 
nicht vorhanden, nicht vorhanden. Man nennt speziell für nominal- 
und ordinalskalierte Daten diese Ausprägungen der Merkmale 
auch Kategorien. Das erste Problem bei der Auswertung solcher 
Daten ist, die Anzahl solcher Kategorien festzulegen und die Be- 
fragten bzw. die Texte oder Fernseh-Sendungen in diese Katego- 
rien einzuordnen. Danach kann dann für zwei solcher Merkmale 
die Stärke des Zusammenhangs festgestellt werden. Sowohl bei 
der Einordnung der Fälle in die Kategorien als auch bei der Fest- 
stellung des Zusammenhangs zweier solcher Merkmale können die 
in diesem Kapitel zu besprechenden Maße eingesetzt werden. 

Als grundsätzlicher Unterschied zu nominalen Daten besitzen 
die ordinalskalierten Daten die zusätzliche Information über die 
Ordnung der Kategorien. Daher ist eine Richtungsangabe möglich: 
die Kategorien können in eine Rangfolge geordnet werden. Als 
Beispiel dienen zwei Merkmale, die in der ALLBUS - Umfrage 
erhoben worden sind. Zum einen wieder das Bildungsniveau, das 
in 5 Kategorien vorliegt: kein Abschluss, Hauptschule, Realschule. 
Fachhochschulreife, Abitur. Dann die Antwortvorgaben auf die 
Frage: Wie hoch ist Ihr politisches Interesse: Sehr stark, stark, 
mittel, wenig, überhaupt nicht. Weil diese Antwortenvorgaben 
sprachlich formuliert sind und nur wenige Kategorien vorliegen, 
liegt bei vorsichtiger Interpretation auch bei dieser Frage kein 
Intervallskalenniveau vor (obwohl es oft für eine solche 5er-Skala, 
auch Likert-Skala genannt, angenommen wird). Eine mögliche 
Vercodung, die die Kategorien ordinal ordnet, ist die folgende: 
kein Abschluss = 1, Hauptschule = 2, ..., Abitur = 5. Ebenso: sehr 
starkes politisches Interesse = 5, ... überhaupt kein politisches 
Interesse = 1 . 

Die Richtung der Vercodung ist offenbar nicht festgelegt: für die 
Schulbildung ist die 1, also ein kleine Zahl, für die geringste Bil- 
dung einsehbar, aber ob man für politisches Desinteresse eine 5 
oder eine 1 verteilt, ist Geschmacksache. Es gebe nun z.B. 7 Be- 
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fragte, die nach dem ersten Merkmal Schulbildung in einer Rang- 
reihe geordnet werden. Dann gibt es drei grundsätzlich verschie- 
dene Möglichkeiten von Rängen, die diese Befragten auf dem 
zweiten Merkmal erzielen können. Die drei Möglichkeiten sind in 
der folgenden Tabelle in den drei letzten Spalten dargestellt: 



Befragter 


Schulbildung 


Pol. Int.(l) 


Pol. Int. (2) Pol 


. Int. (3) 


1 


1 


1 


5 


1 


2 


2 


2 


4 


2 


3 


2 


2 


4 


2 


4 


3 


3 


3 


5 


5 


3 


3 


3 


5 


6 


4 


4 


2 


4 


7 


5 


5 


1 


3 



Im Fall (1) und (2) bestehen sog. monotone Beziehungen: im Fall 
(1) sind alle Ränge in beiden Merkmalen immer gleich, im zweiten 
immer genau invers. Im dritten Fall sind sie auf den ersten drei 
Rängen gleich, auf den letzten drei Rängen invers. Wie sehen 
solche Beziehungen in einer Kreuztabelle beider Merkmale aus? 
Dabei werden die Merkmale beide in der für sie festgelegten 
Rangfolge, aufsteigend nach den Codes, geordnet: 



Fall (1): 



Fall (2): 





yi 


Y2 


ya 


y4 


ya 


Xl 


l 


0 


0 


0 


0 


x 2 


0 


2 


0 


0 


0 


X 3 


0 


0 


2 


0 


0 


X 4 


0 


0 


0 


1 


0 


X 5 


0 


0 


0 


0 


1 





yi 


y 2 


y 3 


y4 


ys 


Xl 


0 


0 


0 


0 


i 


x 2 


0 


0 


0 


2 


0 


X 3 


0 


0 


2 


0 


0 


x 4 


0 


1 


0 


0 


0 


x 5 


l 


0 


0 


0 


0 
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Fall (3): 





yi 


Y2 


Y3 


Y4 


Ys 


Xl 


1 


0 


0 


0 


0 


X 2 


0 


2 


0 


0 


0 


X 3 


0 


0 


0 


0 


1 


X 4 


0 


0 


0 


1 


0 


X 5 


0 


0 


2 


0 


0 



Fall (1) und Fall (2) führen zur Besetzung der Diagonalen in der 
Kreuztabelle, sie bilden eine lineare Beziehung zwischen den bei- 
den Merkmalen. Wenn das der Fall ist, lässt sich mit der Kenntnis 
des einen Merkmals das andere ohne Fehler Vorhersagen. Fall 3 
lässt sich als eine U-förmige Beziehung zwischen den Merkmalen 
beschreiben. 

Der Unterschied zu Kreuztabellen von nominalskalierten Da- 
ten liegt darin, dass sich die Fälle 1 und 2 unterscheiden lassen in 
einen positiven und einen negativen bzw. inversen Zusammen- 
hang. Beim ersten steigt man in der Rangfolge beider Merkmale 
gleichzeitig, beim zweiten steigt man im einen Merkmal genau 
dann, wenn man im anderen Merkmal fällt. Dabei sieht man, dass 
diese Unterscheidung natürlich von der Art der Rangreihenbildung 
bei den Merkmalen abhängt. Bei den als Beispiel verwendeten 
Merkmalen Schulbildung und politisches Interesse würde man z.B. 
erwarten, dass ein Zusammenhang derart besteht, dass bei höherer 
Schulbildung das politische Interesse steigt. Wenn man dann die 
Ränge von Schulbildung von 1 = ohne Abschluss bis 5 = Abitur 
verteilt hat, wird man einen positiven Zusammenhang bekommen, 
wenn das politische Interesse mit 1 = gering bis 5 = hoch vercodet 
worden ist, andererseits einen negativen Zusammenhang, wenn es 
mit 1 = hoch und 5 = gering vercodet worden ist. 

Wenn man von diesen Idealfällen zu einem normalen Daten- 
satz übergeht, dann sind natürlich auch alle anderen Felder der 
Kreuztabelle besetzt. Dann gilt es zu erfassen, ob sich aus den 
Daten in irgendeiner Weise eine Häufung auf einer der Diagonalen 
erkennen lässt, d.h. man muss ein Maß dafür haben, inwieweit die 
tatsächlichen Daten von diesen Idealfällen abweichen. Also sollten 
Maßzahlen für den Zusammenhang ordinalskalierter Daten so 
geeicht werden, dass - wie bei Maßen nominalskalierter Daten 
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auch - die Stärke des Zusammenhangs in einer Zahl zwischen 0 
und 1 , aber zusätzlich die Richtung des Zusammenhangs an Hand 
des Vorzeichens + (gleichgerichteter Zusammenhang) oder - (ge- 
genläufiger oder inverser Zusammenhang) abgelesen werden kann. 



Eigenschaften von Zusammenhangsmaßen M für ordinalskalier- 
te Daten (s. auch Tabelle 10.4) 

M hat Werte in [-1.0; 1.0]; 

M = -1 : perfekter inverser Zusammenhang, 

M = 1 : perfekter positiver Zusammenhang 

M = 0: kein Zusammenhang, stochastische Unabhängigkeit 



11. 2. Relationen von Paaren und ihre Summen 

In welcher Weise ist nun der generelle Zusammenhang zwischen 
zwei ordinalen Merkmalen messbar, wenn nicht die idealen Ver- 
hältnisse des obigen Beispiels vorliegen? Die im Folgenden ver- 
wendeten Maße beruhen alle auf demselben Prinzip, dem Prinzip 
des Paarvergleichs. Das Prinzip nutzt genau die besondere Qualität 
einer ordinalen Skala aus, dass man zu je zwei Kategorien immer 
nur genau eine der drei Relationen >, < oder = hat. Es gebe zwei 
Personen A und B und zwei ordinale Merkmale X und Y, deren 
Ausprägungen in einer Rangreihe geordnet sind. Bzgl. jedes der 
beiden Merkmale weisen die Personen dann genau eine dieser drei 
Relationen auf, z.B. 

A hat x = 3 und y = 2, B hat x = 5 und y = 3 => x A < x B , y A < y B 
A hat x = 3 und y = 4, B hat x = 5 und y = 4 => x A < x B , y A = y A 



Wenn nun zwischen X und Y ein positiver Zusammenhang be- 
steht, so wird man erwarten, dass immer, wenn A < B bzgl. X, 
dann auch A < B bzgl. Y ist, und dasselbe gilt für >. Im Beispiel: 
Wenn die Schulbildung von A größer als die von B, dann ist auch 
sein politisches Interesse größer. Und was nur für dieses Paar (A, 
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B) gilt, wird für desto mehr Paare gelten, je stärker der Zusam- 
menhang der beiden Merkmale ist. Ein Maß für den Zusammen- 
hang zweier ordinaler Merkmale sollte also auf einem Vergleich 
aller Paare der Untersuchung in dieser Art beruhen. Deshalb muss 
zunächst genauer klassifiziert werden, welche Arten von Paaren 
man mit drei möglichen Relationen auf zwei Merkmalen sinnvol- 
ler Weise unterscheiden kann. 

Es ist eine weitere Besonderheit ordinaler Merkmale, dass 
auch die dritte Relation der Gleichheit auftreten kann: x A = x B . 
Denn bei intervallskalierten Merkmalen, wie etwa Körpergröße, 
kann man immer genau genug messen, um letztlich doch einen 
feinen Unterschied in den beliebig teilbaren Messwerten herauszu- 
bekommen, so dass die Relation der Gleichheit bei intervallskalier- 
ten Daten nur vernachlässigbar selten (mit Maß 0) vorkommt. 
Dagegen macht sie bei ordinalen Daten meist einen erheblichen 
Teil der Fälle aus, da die Anzahl der Kategorienkombinationen 
zweier Merkmale meist deutlich kleiner ist als die Fallzahl. Des- 
halb haben sich alle Rangkorrelationsmaße, die auf Paarverglei- 
chen beruhen, mit dem Problem, wie sie diese Gleichheitsrelation 
behandeln können, auseinander zu setzen. 

Tabelle 11.1 zeigt die möglichen Relationen von Paaren. Es 
gibt fünf verschiedene Typen von Relationen. Wie viele Paare gibt 
es aber insgesamt? Das ist eine Formel aus der Kombinatorik: 
Anzahl aller möglichen Paare bei N Personen (ohne Unterschei- 
dung der Reihenfolge) = N(N-l)/2 

Z.B. gibt es bei 5 Untersuchungseinheiten 54 / 2 = 10 Paare, für 
die Untersuchungseinheiten Nr. 1 bis 5 die folgenden: 

(1,2), (1,3), (1,4), (1,5), (2,3), (2,4), (2,5), (3,4), (3,5), (4,5). 

Eine Unterscheidung der Reihenfolge ist nicht nötig, da die fünf 
Paartypen dieselben bleiben, wenn man A und B vertauscht. 
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Tabelle 11.1: Mögliche Relationen von Paaren von Untersu- 
chungsfällen 



Mögliche Relationen von Paaren von Untersuchungsfällen 

1. A und B haben dieselbe Ungleichheitsrelation (concordante 
Paare): 

x A < x B und y A < y B , oder: x A > x B und y A > y B 
Anzahl aller concordanten Paare: N c 

2. A und B haben die entgegen gesetzte Ungleichheitsrelation 

(discordante Paare) 

x A < x B und y A > y B , oder: x A > x B und y A < y B 
Anzahl aller discordanten Paare: N d 

3. A und B haben in X Gleichheit, sonst Ungleichheit ( gebun- 
den oder „tied“ in X) 

x A = x B und y A < y B , oder: x A = x B und y A > y B 
Anzahl aller Paare tied in X: T x 

4. A und B haben in Y Gleichheit, sonst Ungleichheit ( ge- 
bunden oder „tied“ in Y) 

x A < x B und y A = y B , oder: x A > x B und y A = y B 
Anzahl aller Paare tied in Y: T y 

5. A und B haben in X und in Y Gleichheit ( gebunden oder 
„tied“ in X und Y) 

x A = x B und y A = y B 

Anzahl aller doppelt gebundenen Paare: T xy 



Die Anzahlen der fünf verschiedenen Paartypen heißen N c , N d , T x , 
T T 

A y? A xy 

Auf den Summen der 5 Paartypen und der Gesamtanzahl der 
Paare beruhen die Rangkorrelationsmaße. Im Folgenden sollen an 
einem Beispiel die einzelnen Anzahlen dieser Paare berechnet 
werden. Die Berechnung wird einfacher, wenn man sich klar- 
macht, in welchen Beziehungen die verschiedenen Paartypen in 
einer Kreuztabelle der beiden Merkmale X und Y liegen. Für je ein 
Paar A und B stellt man an Hand ihrer Ausprägungen in X und Y 
die Zelle fest, in der A liegt, und die Zelle, in der B liegt, und ver- 
bindet sie mit einer Linie. Dann gilt: 
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• Concordant sind alle Paare, bei denen diese Linie von links 
oben nach rechts unten geht. 

• Discordant sind alle Paare, bei denen diese Linie von links 
unten nach rechts oben geht. 

• Gebunden in X sind alle Paare, bei denen die Linie senkrecht 
in den Spalten x verläuft (X ist hier ausnahmsweise waage- 
recht abgetragen) 

• Gebunden in Y sind alle Paare, bei denen die Linie waage- 
recht in den Zeilen y verläuft 

• Doppelt gebunden sind alle Paare, die in derselben Zelle lie- 
gen 




Abbildung 11.1: Mögliche Lagen von Paaren in Bezug auf ordinale Ordnungsrela- 
tionen (nach Benninghaus: 244) 



Die Berechnung erfolgt an einer Beispieltabelle, die nicht quadra- 
tisch ist, d.h. bei der die beiden Merkmale nicht dieselbe Anzahl 
an Ausprägungen haben. Die Zahlen sind eine Zufallsstichprobe 
aus dem ALLBUS-Datensatz von 1994 für die beiden oben er- 
wähnten Merkmale, deren Kategorien zusammengefasst wurden. 
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VI ist die Schulbildung: 

V2 ist das politische Interesse: 



Rang 1 = Hauptschule 

Rang 2 = mindestens Realschule 

Rang 1 = mehr als mittel 

Rang 2 = mittel 

Rang 3 = weniger als mittel 



VI \ V2 


1 


2 


3 


E 


1 


a = 3 


b = 16 


c = 6 


25 


2 


d =17 


e = 14 


f = 3 


34 


E 


20 


30 


9 


59 



Anzahl concordanter Paare: N c = a (e + f) + b f 
= 3 (14 + 3) +16-3 = 51 +48 = 99 
Anzahl discordanter Paare: N d = c (d + e) + bd 
= 6 (17+14) + 16-17 = 186+272 = 458 
Anzahl in V2 gebunden: T x = ad + be + cf 
= 3-17 + 16-14 + 6-3 = 51+224+18 = 293 
Anzahl in V 1 gebunden: T y = a (b + c) + bc + d (e + f) + ef 
= 3(16+6) + 16-6+ 17(14+3) + 14-3 = 66+96+289+42= 493 
Anzahl doppelt gebunden: T xy = a(a-l)/2 + ... + f(f-l)/2 
= 3(3-l)/2 + 1 6 ( 16-1 )/2 + 6(6-l)/2 + 17(17-l)/2 + 14(14-l)/2 
+ 3(3-l)/2 = 3+120+15+136+91+3 = 368 
Anzahl Paare insgesamt: N (N-l) / 2 = 59-58/2 = 59-29 = 1711 

Es gilt per definitionem: N c + N d + T x + T y + T xy = N(N-l)/2 (da- 
mit kann man die Rechnung kontrollieren!) 



11.3 Die Berechnung der Maße 

Die Maßzahlen für die Stärke des Zusammenhangs beider Merk- 
male beruhen alle auf einem Vergleich der concordanten mit den 
discordanten Paaren. Wenn in einer quadratischen Kreuztabelle 
nur eine der beiden Diagonalen besetzt ist, gibt es nur discordante 
oder nur concordante Paare. Wenn alle Paare concordant sind, 
dann kann man für jeweils zwei Personen den „Größer“ - Unter- 
schied bzgl. des einen Merkmals auch bei dem anderen Merkmal 
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feststellen; dann hat das Maß den Wert 1. Wenn alle Paare discor- 
dant sind, dann ist ein „Größer“ - Unterschied bei einem Merkma- 
le genau mit einem „Kleiner“-Unterschied beim anderen Merkmal 
verknüpft; dann hat das Maß den Wert -1. 

Wenn es genau gleich viel concordante und discordante Paare 
gibt, kann man von einem Unterschied in einem Merkmal mit der 
gleichen Wahrscheinlichkeit denselben oder den entgegen gesetz- 
ten Unterschied im anderen Merkmal Voraussagen, so dass dann 
das Maß 0 sein sollte. Die Differenz von concordanten und discor- 
danten Paaren ist deshalb die wichtigste Größe bei allen Maßen. 
Bezieht man diese Differenz auf die Anzahl aller con- bzw. dis- 
cordanten Paare, so erhält man eine erste Maßzahl, die y genannt 
wird: 



Definition : Das Maß y (Goodman und Kruskals Gamma) 
wird berechnet als 



y= 



N c -N d 
N c + N d 



Wenn es nur concordante Paare gibt, ist N d = 0 und y = 1 , entspre- 
chend N c = 0 und y = -1 bei nur discordanten Paaren. 

Für diese Maßzahl spielen offenbar die gebundenen Paare 
überhaupt keine Rolle; es könnten also beliebig viele gebundene 
Paare hinzukommen, ohne dass sich y ändert. Deshalb gibt es wei- 
tere Maße, die die „Ties“ (engl, für Bindungen) berücksichtigen. 
Dazu gehören die verschiedenen x‘s von Kendall. Das nahelie- 
gendste wäre, in den Nenner alle mögliche Paare zu schreiben, 
also 



Definition-. Das Maß T a (Kendalls Tau - a) wird so berechnet: 



_ N c - N d 

a 1 

- • N(N - 1) 
2 
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Diese Maßzahl T a hat wiederum den Nachteil, dass sie niemals die 
Extremwerte 1 oder -1 annehmen kann, wenn gebundene Paare 
vorhanden sind. Kendall hat deshalb weitere Veränderungen des 
Nenners vorgeschlagen und weitere Maßzahlen konstruiert: 



Definition : Die Maße Tb und T c (Tau - b und Tau - c) werden 
wie folgt berechnet: 

T = N c -N d 

b V N c + N d +T XA /N c +N d +T y 

_ Ne mit m = Minimum(Zeilen, Spalten) 

KN 2 -/ m 



Beide Kennwerte versuchen, die gebundenen Paare in ihrem Maß 
zu berücksichtigen. Bei x b wird der Zusammenhang als umso klei- 
ner gemessen, je mehr gebundene Paare auftreten. Das erscheint 
sinnvoll, wenn man bedenkt, dass bei Bindungen eine Vorhersage 
auf Grund des einen Merkmals nicht möglich ist. x b kann jedoch 
die Maximalwerte von + oder - 1 nur in quadratischen Tabellen 
erreichen, in denen Zeilen- und Spaltenzahl gleich sind, da in 
rechteckigen Tabellen notwendigerweise immer Ties auftreten. x c 
kann auch bei nichtquadratischen Tabellen + oder - 1 werden und 
ist dort i.A. etwas höher als x b , hat aber einen schwer zu interpre- 
tierenden Nenner. 

Wenn man die Größen der Nenner vergleicht, kommt man auf 
die Beziehung 

Xa < T b < Y 

wobei Gleichheit erreicht wird, wenn keine Ties vorhanden sind. 

Die bisherigen Maßzahlen waren alles symmetrische Maße, in 
denen die Bindungen in dem einen oder anderen Merkmal gleich 
behandelt wurden. Es gibt noch weitere Maßzahlen von Somer, die 
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diese Ties unterschiedlich berücksichtigen und deshalb asymmet- 
risch sind. 



Definition : Das Maß d (Somer’s d) ist asymmetrisch und wird 
so berechnet: 



xy 



N c -N d 
N c + N d +T X 



d ^c-^d 

yx N c + N d +T y 
Die symmetrische Form ist Somers d s 

N t + Nd+i(T,+T,) 



Dabei bedeutet der Index xy, dass x von y bewirkt wird, und um- 
gekehrt yx, dass x die Ursache von y ist. Die Annahme dabei ist 
folgende: wenn Merkmal X die Ursache von Merkmal Y, also X 
die unabhängige und Y die abhängige Variable ist, dann darf der 
Fall eigentlich nicht auftreten, dass ein Unterschied in X keine 
Wirkung in Y hat, dass also Ties in Y auftreten; für Ties in Y gibt 
es also eine Verringerung der Stärke des Maßes. 

Offenbar sind Somers d’s immer kleiner als y: 

d yx < Y und es gilt x b 2 = d xy d yx 

Damit wären die gebräuchlichsten Maße beschrieben. Eine Be- 
rechnung mit den im obigen Beispiel berechneten Paarsummen: 

y = (99-458)/557 = - 0,664 

x b = (99-458)/ (V(557+293)V(557+493» = -359 / 944,61= -0,380 
d xy = (99-458)/ (99+458+293) = -0,422 

Der Zusammenhang ist negativ: Wenn die Schulbildung von Rang 
1 = Hauptschule auf Rang 2 = mindestens Realschule steigt, geht 
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das politische Interesse im Rang von 3 = weniger als mittel auf 
Rang 1 = mehr als mittel zurück. Hier kommt die Vercodung zum 
Tragen: bei höherer Schulbildung geht der „Rang“ des politischen 
Interesses zurück, was jedoch bedeutet, dass das politische Interes- 
se zunimmt, da ein geringerer Rang hier höheres politisches Inte- 
resse bedeutet. Die Stärke des Zusammenhangs ist mittelmäßig, 
d.h. es besteht auf jeden Fall ein Zusammenhang, aber er erklärt 
nur einen mittelgroßen Teil der Beziehung. Mit Hilfe der obigen 
Formeln weiß man aber genauer, was ein x b dieser Größe 0,38 
aussagt: es gibt etwa 5 mal soviel discordante wie concordante 
Paare (99 zu 493), bei etwa doppelt soviel gebundenen Paaren 
(293 + 493 + 368), über die wegen ihrer Bindung nichts ausgesagt 
werden kann. 



11.4 Konfidenzintervalle und Signifikanz 

Zwei Fragen stellen sich, wenn man die aus einer Stichprobe be- 
rechneten Rangkorrelationsmaße auf die Grundgesamtheit ausdeh- 
nen will: 

1. Ist ein festgestellter positiver oder negativer Zusammenhang 
wirklich von 0 verschieden, d.h. gibt es einen signifikanten 
Zusammenhang zwischen den Merkmalen, oder ist er nur 
durch den Zufall bei der Auswahl der Stichprobe verursacht? 

2. Wenn ja, mit welcher Sicherheit ist das in der Stichprobe 
festgestellte Maß auch das Maß für die Grundgesamtheit, 
m.a.W., wie groß ist das Konfidenzintervall um den geschätz- 
ten Wert zu einem vorgegebenen Sicherheits-Niveau a? 

Um diese Fragen zu beantworten, benötigt man, wie auch schon in 
Kap. 10 für die dortigen Maße, die Angabe über die Verteilung der 
Maße. Da alle eben definierten Maße genau dann 0 werden, wenn 
der Zähler 0 wird, basiert die Verteilung aller dieser Maße auf der 
Differenz S = N c -N d . Sie ist, wenn der wahre Wert 0 ist, wie folgt 
normalverteilt. 
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Wenn in der Grundgesamtheit kein Zusammenhang besteht und 
die Anzahl gebundener Paare klein ist, ist die Größe S = N c - N d 
normal verteilt um 0 mit Varianz 

Ss =t~N(N-1)(2N + 5) 

1 O 

d.h. S « N(0, s s ) 



(Blalock 1979:438. Die Formel bei Vorhandensein von vielen Ties 
in Blalock 1979:463f.). 

Die erste Frage, ob es überhaupt einen Zusammenhang gibt, 
kann reduziert werden auf die Frage, ob der Zähler aller dieser 
Maße, die Größe S, auch in der Grundgesamtheit von 0 verschie- 
den ist, oder ob die Abweichung von S von 0 nicht durch Zufall 
zustande gekommen ist. Die erste Frage wird also durch einen Test 
auf Null beantwortet (s. Kap. 9.3). Deshalb wird zunächst S stan- 
dardisiert, 

S standardisiert — ( S - 0) / Ss — S / Ss 

damit es standardnormalverteilt wird. Wenn S dann signifikant 
(zum Niveau a) nicht Null sein soll, muss es außerhalb des Konfi- 
denzintervalls um 0 zum Niveau a liegen, z.B. muss für a = 0,05 

I ^standardisiert I ^ ZOC/2 — 1,96 

gelten. Mit dem obigen Beispiel: 

S = 99-458 = -359, 

s s 2 = 1/18 ( 59 ( 59-1) ( 118 + 5) = (1/18 ) (59-58 123) = 23383 
s s = V23383 = 152 
I S I / s s = 359/ 152 = 2,36 > 1,96, 

d.h. es gibt eine statistische Signifikanz zum 5%-Niveau, dass der 
Überhang der discordanten Paare nicht zufällig auf Grund der 
Stichprobe zustande gekommen sein kann, dass also der Zusam- 
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menhang: je höher das Bildungsniveau, desto höher das politische 
Interesse, in der Population, hier „alle Deutsche“, besteht. 

Aus der Varianz von S kann ebenfalls ein Standardfehler für 
die verschiedenen Maße berechnet werden. Mit einem solchen 
Standardfehler kann man ein Konfidenzintervall um das geschätzte 
Maß berechnen und damit die zweite Frage der Sicherheit der 
Stärke des Zusammenhangs beantworten. Dabei geht man nach der 
bekannten Formel eines Konfidenzintervalls zum Niveau a um 
den geschätzten Wert vor (Kap. 9.2), z.B. für Tb 



Sei st Standardfehler von Tb, dann ist 

[-ST ■ Zaj 2 + T b J T b + ST • Z 1 _ ce / 2 ] 

das Konfidenzintervall zum Niveau a von T b 



Weil alle hier behandelten Maße annähernd normalverteilt sind, 
kann als Funktion „z“, der Verteilungsfunktion der Maße, die 
Standardnormalverteilung genommen werden; im Fall von a = 5% 
z.B. 

[-ST • 1,96 + Tb ; T b + ST ■ 1,96] 

Der folgende Ausdruck (Tabelle 11.2a) ist das Ergebnis, das SPSS 
für diese ganzen Koeffizienten ausgibt, und zwar genau beim obi- 
gen Problem des Zusammenhangs von Schulbildung (V12 in 
ALLBUS 94) und politischem Interesse (VI 17 in ALLBUS 94). 
Betrachtet man zunächst die Kreuztabelle der absoluten Zahlen, so 
sieht man, dass in der ersten Zeile die Werte von links nach rechts 
tendenziell größer werden, während sie in der letzten Zeile in der 
Tendenz kleiner werden; es gibt also eine Tendenz zu einer Häu- 
fung von rechts oben nach links unten, d.h. zu einem inversen 
Zusammenhang, dessen Stärke allerdings vom mittleren, schwer 
zu erfassenden Teil der Tabelle abhängt. 
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Tabelle 11.2a: Zusammenhangsmaße für die Beziehung zwischen 
Schulabschluss und politischem Interesse ( mit SPSS) 

ALLGEMEINER SCHULABSCHLUSS * POLITISCHES INTERESSE, BEFR. <ORDINAL> Kreuztabelle 



Anzahl 





I POLITISCHES INTERESSE, BEFR. <ORDINAL> 






SEHR STARK 


STARK 


MITTEL 


WENIG 


UEBERHA 
UPT NICHT 


Gesamt 


ALLGEMEINER VOLKS-, 

SCHULABSCHLUSS HAUPTSCHULAB 


75 


219 


741 


386 


228 


1649 


MITTL.REIFE,REALSC 


87 


189 


460 


209 


72 


1017 


FACHHOCHSCHULRE 

FE 


22 


54 


72 


15 


1 


164 


ABITUR, HOCHSCHUL 
El. 


81 


175 


172 


52 


9 


489 


Gesamt 


265 


637 


1445 


662 


310 


3319 



Symmetrische Maße 







Wert 


Asymptoti 

scher 

Standardf 

ehler 


Näherung 
sweises T 


Näherung 

sweise 

Signifikanz 


Ordinal- bzgl. 


Kendall-Tau-b 


-,246 


,014 


-17,271 


,000 


Ordinalmaß 


Kendall-Tau-c 


-,222 


,013 


-17,271 


,000 


Gamma 

Anzahl der gültigen Fälle 


-,361 

3319 


,020 


-17,271 


,000 



Richtungsmaße 





Wert 


Asymptoti 

scher 

Standardf 

ehler 


Näherung 
sweises T 


Näherung 

sweise 

Signifikanz 


Somers-d Symmetrisch 

ALLGEMEINER 


-,246 


,014 


-17,271 


,000 


SCHULABSCHLUSS 

abhängig 

POLITISCHES 


-,232 


,013 


-17,271 


,000 


INTERESSE, BEFR. 
<ORDINAL> abhängic 


-,262 


,015 


-17,271 


,000 



SPSS gibt in der ersten Spalte die Werte der Koeffizienten an. 
Man bemerkt 

- y ist mit Abstand der größte Wert, da er Ties nicht berücksichtigt, 

- Somers d’s sind unterschiedlich, u.a. da hier eine unsymmetri- 

sche Tabelle vorliegt, 

- die Werte (außer y) liegen recht gut beieinander, bei ca. 0,24. 

Die zweite Spalte gibt den Standardfehler des geschätzten Werts 
an. Damit kann ein 95% - Konfidenzintervall, z.B. für x b zum 
Niveau 5%, berechnet werden: 
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[-0,014-1,96-0,246; -0,246 + 0,014 • 1,96] = 

[-0,027 - 0,246; -0,246 + 0,027] = [-0,273; -0,219] 

In diesen Grenzen liegt mit 95%-iger Wahrscheinlichkeit der wah- 
re Wert von x b in der Grundgesamtheit. Wie man an der Größe 
dieses Intervalls sieht, liegen bis auf y alle anderen Maße innerhalb 
dieses Konfidenzintervalls, so dass es im Hinblick auf die statisti- 
sche Genauigkeit der Maße hier keinen Unterschied zwischen den 
verschiedenen Maßen gibt. 

In der dritten Spalte „Näherungsweises T“ gibt SPSS die Prüf- 
größe in der Skalierung der Standardnormalverteilung an, die mit 
dem Wert für das gewünschte Signifikanzniveau a verglichen 
werden kann, um zu testen, ob überhaupt ein Zusammenhang be- 
steht. Nach den obigen Ausführungen müsste die Größe genau die 
erste Spalte, dividiert durch die zweite Spalte sein, denn durch 
diese Division wird das Maß standardisiert. Ganz so einfach liegen 
die Dinge aber nicht, weil der Standardfehler nämlich noch davon 
abhängt, welches der wahre Wert tatsächlich ist, so dass der Stan- 
dardfehler bei einem wahren Wert ungleich 0 ein anderer ist, als 
bei einem wahren Wert gleich 0, der beim Signifikanztest voraus- 
gesetzt wird. Deshalb ist die dritte Spalte nur angenähert die erste 
durch die zweite. Ist die Größe in der dritten Spalte größer als die 
Größe der Prüfverteilung, die die Grenze der „zufälligen“ Streuung 
für das gewählte Niveau bildet (z.B. 1,96 für 5%-Niveau bei Nor- 
malverteilung), dann ist das Zusammenhangs-Maß nicht zufällig 
so groß. 

Die vierte Spalte gibt, wie schon am Ende von Kapitel 10.5 
besprochen, den Anteil derjenigen Stichproben an, die, wenn der 
wahre Wert 0 ist, durch Zufall noch größer als der Wert der dritten 
Spalte sein können. Diese Zahl ist gleichbedeutend mit dem Signi- 
fikanzniveau der Prüfgröße. Hier besteht mit sehr hoher Wahr- 
scheinlichkeit ein Zusammenhang beider Merkmale, da der Wert 
in der vierten Spalte kleiner als 0,000 ist. 
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11. 5. Vergleich und Kritik der Maße 

11.5.1 Vergleich der Maße 

An der Vielfalt der Maße kann man schon sehen, dass es bei der 
Messung des Zusammenhangs ordinaler Merkmale kein Standard- 
Verfahren gibt. In der folgenden Aufstellung sind ihre Eigenheiten 
verglichen: 



Vergleich der Eigenschaften der Zusammenhangsmaße 

1. Alle Maße sind 0 bei Gleichheit von con- und discordanten 
Zahlen, da alle im Zähler die Differenz N c - N d haben, posi- 
tiv beim Überwiegen von concordanten, und negativ beim 
Überwiegen von discordanten Paaren. 

2. y ist immer am größten, weil es überhaupt keine Ties im 
Nenner berücksichtigt. 

3. Alle Maße, die Ties im Nenner berücksichtigen, können in 
einer nichtquadratischen Tabelle nicht + oder - 1 werden, da 
dort notwendigerweise immer Ties auftreten. 

4. Bei Nichtvorhandensein von Ties sind alle Maße gleich. 

5. Die Extremwerte + und - 1 werden außer bei y und x c nur für 
solche quadratischen Matrizen angenommen, bei denen nur 
die Diagonale besetzt ist. 



Je nachdem, welche Maßzahl man wählt, bekommt man eine ande- 
re Angabe über die Stärke des Zusammenhangs. Wenn man diese 
Angaben untereinander vergleichen will, muss man jedenfalls 
berücksichtigen, wie sie berechnet werden; erst auf dieser unter- 
schiedlichen Berechnungsgrundlage können sie Besonderheiten 
der Daten widerspiegeln. 

Welches Maß man nun bei einer eigenen Auswertung nehmen 
sollte, ist nicht statistisch zu entscheiden, sondern nur inhaltlich. 
Insbesondere muss dabei entschieden werden, welche Rolle die 
Bindungen, die Ties, für die Interpretation haben. Beim obigen 
Beispiel vom Zusammenhang zwischen Bildung und politischem 
Interesse sollten die Ties berücksichtigt werden, da sie einen gro- 
ßen Teil der Paarbeziehungen ausmachen. Man könnte zusätzlich 
hier eine klare Ursache-Wirkungs-Beziehung postulieren derart. 
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dass auf jeden Fall die Schulbildung Ursache des politische Inte- 
resses ist, da sie in den allermeisten Fällen bei den Befragten, die 
alle über 18 Jahre alt sind, dem jetzigen politischen Interesse zeit- 
lich vorhergegangen ist. Deshalb könnte man hier z.B. Somers d 
mit politischem Interesse als abhängiger Variabler nehmen. 

Die Frage der unterschiedlichen Höhe der Maße spielt aller- 
dings praktisch zum Glück gar keine so große Rolle, da sie oft so 
nahe beieinander liegen, dass sie statistisch, d.h. im Konfidenzin- 
tervall, sich gar nicht unterscheiden. Am häufigsten verwendet 
wird das Maß Tb, weil es für Vierfeldertafeln den gleichen Wert 
annimmt wie das Kontingenzmaß <t> aus dem vorigen Kapitel und 
wie der Korrelationskoeffizient r, der im folgenden Kapitel erklärt 
wird. 

11.5.2 Kritische Bewertung der Maße 

1. Wenn die Maße 0 sind, bedeutet das nicht immer, dass die bei- 
den Merkmale unabhängig sind! D.h. die Bedeutung des Werts 0, 
die man von den Kontingenzmaßen aus dem vorigen Kapitel kennt 
und die man eigentlich erwartet, ist hier nicht gegeben. Ein Bei- 
spiel: 



5 


0 


0 


5 


0 


0 


10 


10 


0 


10 


0 


10 


5 


10 


10 


25 



Bei dieser Tabelle ist N c = 5 (10 + 10) = 5-20 = 100, und N d = 
1010 = 100, so dass alle Maße im Zähler und damit insgesamt 0 
werden. Aber offenbar sind beide Merkmale nicht stochastisch 
unabhängig, denn dann müssten sich die Randverteilungen in der 
Tabelle wiederfinden, d.h. sie müsste wie folgt aussehen: 



1 


2 


2 


5 


2 


4 


4 


10 


2 


4 


4 


10 


5 


10 


10 


25 
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2. y kann 1 und die anderen Maße ebenfalls sehr groß werden, 
obwohl kein eindeutiger Zusammenhang besteht. Ein Beispiel: 



10 


5 




15 




5 


5 


10 






5 


5 


10 


10 


10 


30 



Bei dieser Tabelle ist N d = 0, da das untere Dreieck komplett 0 ist. 
Deshalb ist y hier 1, und die anderen Maße sind in einem solchen 
Fall je nach Größe der Ties ebenfalls recht groß. Trotzdem kann 
man aus einem Merkmal nicht eindeutig auf das andere schließen. 

3. Die Maße sind nicht stabil, wenn die Anzahl der Kategorien 
verändert wird. Bei einem guten Maß sollte man erwarten, dass die 
Stärke des Zusammenhangs stabil bleibt, wenn man eine Kategorie 
in zwei Hälften aufteilt oder zwei gleichwertige Kategorien zu- 
sammenlegt. Das ist nicht der Fall, die Maße sind i.A. größer, je 
weniger Kategorien gebildet werden. Wieder ein Beispiel: 



a 


b 


a+b 


c 


d 


c+d 


a+c 


b+d 


a+b+c+d 



Hier ist N c = ad und N d = bc, und z.B. y = (ad-bc) / (ad+bc). 

Die zweite Kategorie des ersten Merkmals wird gleichmäßig auf- 
geteilt: 



a 


b/2 


b/2 


a+b 


c 


d/2 


d/2 


c+d 


a+c 


(b+d)/2 


(b+d)/2 


a+b+c+d 



Man sollte erwarten, dass diese Änderung das Maß nicht verän- 
dert, da die grundsätzlichen Relationen der ersten Kategorie zu den 
beiden neuen gleich geblieben sind und die zwei neuen Kategorien 
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untereinander unabhängig sind. Für die veränderte Tabelle gilt 
aber: 

N c = a( d/2 +d/2) + b/2 -d/2, N d = b/2 ( c+ d/2) + b/2 -c, 
so dass mit 

N c - N d = ad + b/2-d/2 - b/2-d/2 - bc = ad - bc 

der Zähler aller Maße zwar gleich bleibt, der Nenner hingegen, 

N c + N d = ad + b/2 -d/2 + b/2-d/2 + bc = ad + bc + bd/2 
zu nimmt, so dass alle Maße kleiner werden bei einer Vergröße- 
rung der Zahl der Kategorien, die nur eine stochastisch unabhängi- 
ge Kategorienteilung vornimmt. 

Der letzte Kritikpunkt ist eine zentrale Schwierigkeit bei die- 
sen Maßen. Wie eingangs erwähnt, sind ordinalskalierte Merkmale 
mit wenigen Kategorien häufig gerade bei vielen sozialwissen- 
schaftlichen Daten anzutreffen. Und fast immer ist die Anzahl der 
Kategorien, d.h. der Ausprägungen eines solchen Merkmals nicht 
durch eine irgendwie „natürliche“ Ordnung vorgegeben, wie es 
z.B. bei den Schulbildungsabschlüssen der Fall ist, sondern wird 
von der Forscherin festgelegt. Aber wenn diese Maße von der 
gewählten Anzahl der Kategorien abhängen, haftet dadurch der 
Feststellung der Stärke eines Zusammenhangs zwischen zwei 
solchen Merkmalen eine gewisse Willkür an. 

Eine gängige Praxis bei der Feststellung von Zusammenhän- 
gen ist z.B. die Dichotomisierung oder bestenfalls Trichotomisie- 
rung von Merkmalen, d.h. die Zusammenlegung von ursprünglich 
einer größeren Zahl von Kategorien zu zwei oder höchstens drei. 
Das hängt damit zusammen, dass i.A. bei Auswertungen von 
sprachlichem Material immer nur kleine Fallzahlen auftreten. Man 
kann sich nicht 1000 Lebensläufe erzählen lassen oder 500 Ju- 
gendliche 3 Stunden lang interviewen. Bei kleinen Fallzahlen unter 
100 oder sogar 50 stellt sich dann beim Aufstellen einer Kreuzta- 
belle immer das Problem, dass einzelne Zellen gar nicht oder nur 
mit sehr kleinen Zahlen besetzt sind. Aus diesem Grund geht man 
dann dazu über, Kategorien zusammenzufassen, um damit größere 
Zahlen in den Zellen zu erhalten. 

Aber gerade diese Praxis verändert die Ergebnisse der Mes- 
sung des Zusammenhangs, wie eben gezeigt wurde, in Richtung 
darauf, dass die Maße einen stärkeren Zusammenhang anzeigen, 
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als bei der ursprünglichen Kategorisierung zu erwarten gewesen 
wäre. Es besteht deshalb die Gefahr einer artefaktischen Zusam- 
menhangs-Feststellung zwischen Merkmalen durch die , falsche’ 
Wahl der Kategorieanzahl. 

Tabelle 11.2b: wie Tabelle 11.2a, nur nach Dichotomisierung 

Schulabsschluss * Politisches Interesse Kreuztabelle 



Anzahl 





1 Politisches Interesse 


Gesamt 


Stark 


Wenig 


Schulabsschluss Haupt u. Real 


299 


661 


960 


FHS und Abitur 


332 


77 


409 


Gesamt 


631 


738 


1369 



Richtungsmaße 





Wert 


Asymptoti 

scher 

Standardf 

ehler 


Näherung 
sweises T 


Näherung 

sweise 

Signifikanz 


Somers-d Symmetrisch 


-,458 


,023 


-18,411 


,000 


BILD abhängig 


-,422 


,023 


-18,411 


,000 


POL abhängig 


-,500 


,024 


-18,411 


,000 



Symmetrische Maße 





Wert 


Asymptoti 

scher 

Standardf 

ehler 


Näherung 
sweises T 


Näherung 

sweise 

Signifikanz 


Kendall-Tau-b 


-,459 


,023 


-18,411 


,000 


Kendall-Tau-c 


-,419 


,023 


-18,411 


,000 


Gamma 


CD 

O 


,025 


-18,411 


,000 


Anzahl der gültigen Fälle 


| 1369 | 









Als Beispiel für den Effekt der Zusammenlegung von Kategorien 
sind in der obigen Tabelle 1 1.2b die Maße für dieselben Merkmale 
noch einmal berechnet nach einer Dichotomisierung der Merkmale 
in jeweils zwei Kategorien, wobei für die Dichotomisierung des 
politischen Interesses außerdem diejenigen, die „mittel“ angegeben 
haben, ganz aus der Analyse ausgeschlossen wurden. 
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Wie man sieht, steigen alle Koeffizienten beträchtlich, vor 
allem y, so dass der Eindruck entsteht, dass hier doch ein einiger- 
maßen hoher Zusammenhang besteht. Diesen Eindruck hatte man 
mit den Originalkategorien dagegen eher nicht, und das dürfte der 
Wirklichkeit eher entsprechen. 



11.6. PRE-Interpretation der Maße 

Um verständlicher zu machen, wie eine Rangkorrelationsmaßzahl 
interpretiert werden kann, kann auch hier das Konzept des „pro- 
portional reduction of error“ (PRE) angewandt werden (s. Kap. 
10.5). Wenn man weiß, dass beide Merkmale perfekt Zusammen- 
hängen, bedeutet das Folgendes: wenn man von zwei Personen 
ihren Unterschied im ersten Merkmal kennt und von der ersten 
Person das zweite Merkmal weiß, dann kann man für die zweite 
Person das zweite Merkmal sicher Vorhersagen. Wenn andererseits 
die beiden Merkmale überhaupt nicht Zusammenhängen, könnte 
man mit dem Wissen, dass zwei Personen sich auf dem einen 
Merkmal unterscheiden, nichts anfangen; die beste Methode, das 
zweite Merkmal für die zweite Person vorherzusagen, wäre zu 
raten, d.h., man wird in der Hälfte der Fälle raten, dass das zweite 
Merkmal größer als bei der ersten Person ist, und in der anderen 
Hälfte der Fälle raten, dass es kleiner ist. 

Voraussage des zweiten Merkmals y für Person B bei Kenntnis des 
Unterschieds zwischen A und B im ersten Merkmal x für perfekten 
lind keinen Zusammenhang beider Merkmale: 

Person 1. Merkmal 2. Merkmal 2. Merkmal 

(perfekt. Zush. ) (kein Zush.) 

A x=2 y=3 y = 3 

Voraussage für B: 

B x=4 y > 3, da x A <x B 50% y>3, 50% y<3 

Diese beiden Prognosemöglichkeiten dienen als Basis des PRE- 
Konzepts. Man macht für jedes Paar mit Kenntnis des Unter- 
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schieds im ersten Merkmal zwei Vorhersagen für den Unterschied 
im zweiten Merkmal: 



Das PRE-Konzept („proprtional reduction of error“): 

Prognose 1: Man berücksichtigt die Kenntnis des ersten Merk- 
mals nicht, sondern rät den Unterschied im zweiten Merkmal. 
Prognose 2: Man prognostiziert den Unterschied im zweiten 
Merkmal auf Grund des Unterschieds im ersten Merkmal. 
Anzahl Fehler ( = falsch prognostiz. Paare) bei Prognose 1 : Ej 
Anzahl der Fehler bei Prognose 2: E 2 

Die Fehlerreduktion PRE ist dann definiert als 
PRE = ( Ej -E 2 ) /E, 



Erwartbar ist zunächst, dass mit Kenntnis des Zusammenhangs 
auf dem ersten Merkmal weniger Fehler gemacht werden als mit 
der Methode des reinen Ratens. Dann wird die Zahl PRE positiv. 
Sie bleibt 0, wenn die Kenntnis des ersten Merkmals nichts er- 
bringt für die Prognose und die Fehlerzahl E 2 deshalb genauso 
groß ist wie beim Raten. Sie wird dagegen 1, wenn der Zusam- 
menhang perfekt ist: dann werden alle zweiten Merkmale richtig 
vorhergesagt und E 2 ist 0, so dass PRE = 1 wird. Ein PRE von 0,5 
besagt also, dass der Zusammenhang zwischen den Merkmalen 
gerade so stark ist, dass für jedes zweite Paar aus der Kenntnis des 
Unterschieds im ersten Merkmal der Unterschied im zweiten 
Merkmal erschlossen werden kann. 

Für die oben definierten Maße kommt es nun darauf an, ob sie 
eine solche PRE-Interpretation besitzen, d.h. ob entsprechende 
Prognoseregeln für sie angegeben werden können. Das ist für die 
Maßzahl y einfach. 

PRE-Interpretation von y: 

Prognoseregel 1 (y): Zufallsprognose: egal, wie der Unterschied im 
ersten Merkmal ist, prognostiziere in der Hälfte der Fälle einen 
positiven und in der Hälfte einen negativen Unterschied im zwei- 
ten Merkmal. Der Fehler, den man dann macht, ergibt sich zu 0,5- 
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(N c + N d ), weil man genau die Hälfte der concordanten und genau 
die Hälfte der discordanten Paare falsch rät. 

Prognoseregel 2 (y) : Sage den Unterschied im zweiten Merkmal 
genau so vorher wie er bei der Mehrzahl aller Paare im ersten 
Merkmal ist. Der Fehler, den man dann begeht, ist genau der, dass 
man entweder alle discordanten oder alle concordanten Paare 
falsch vorhersagt, je nachdem, welche in der Minderzahl sind. Es 
gilt also: 

y : PRE-Prognoseregell: Ei = 0,5 (N c + N d ), 
y : PRE-Prognoseregel2: E 2 = min(N c , N d ) 

Damit wird 

PRE = (E 1 -E 2 )/E 1 

= (0,5 (N c + Na) - min(N c , N d ))/ (0,5 (N c + N d )). 

Nun werden die zwei Fälle unterschieden: 

a) min(N c , N d ) = N d . 

Dann ist 

PRE = (0,5 ( N c + Na) - N d ))/ (0,5 ( N c + N d ) 

= (N c + N d - 2N d ) / (N c + N d ) = Y 

b) min(N c , N d ) = N c . 

Dann ist die Beziehung invers, da die discordanten Beziehungen 
überwiegen, und 

PRE = (0,5 (N c + Nd) - N c )/ (0,5 (N c + N d ) 

= (N c + N d - 2N C ) / (N c + N d ) = - Y 
Aus a) und b) zusammen folgt PRE = ± Y 

Mit diesen beiden Regeln ist also der Wert von y direkt zu inter- 
pretieren als die zusätzliche prozentuale Anzahl der Paare, deren 
Unterschied im zweiten Merkmal über reines Raten hinaus richtig 
vorhergesagt werden kann, wenn man den Unterschied im ersten 
Merkmal berücksichtigt. 

Diese mögliche PRE-Interpretation von y ist davon abhängig, 
dass bei y die gebundenen Paare, die Ties, nicht berücksichtigt 
werden müssen. Es lassen sich aber auch für x b entsprechende 
Vorhersage-Regeln finden, die es möglich machen, die Maßzahl x b 
in ähnlicher Weise wie hier bei y als prozentualer Anteil der Prog- 
nose-Verbesserung durch Kenntnis der Unterschiede im ersten 
Merkmal zu interpretieren. 
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Wie ist mit der PRE-Interpretation z.B. der Wert von - 0,246 
für x b aus der obigen Tabelle zu interpretieren? Der Wert besagt 
dann folgendes: wenn man die Kenntnis des Zusammenhangs, dass 
mehr Schulbildung zu stärkerem politischen Interesse führt, aus- 
nutzt, kann man bei der Vorhersage des politischen Interesses aus 
der Schulbildung etwa ein Viertel der Fehler, die man bei reinem 
Raten machen würde, vermeiden, die Vorhersage ist etwa um ein 
Viertel besser. 



11.7. Fehlinterpretation bei Nichtlinearität und Drittvariablen 

11.7.1 Nichtlinearität in der Beziehung der Merkmale 
Aus einem weiteren Grund kann die Zusammenlegung von Kate- 
gorien auf eine kleine Zahl dazu führen, dass man bei der Interpre- 
tation der Daten auf eine falsche Fährte geführt wird. Noch einmal 
das erste Beispiel mit dem Vergleich der Rangreihen: 





yt 


Y2 


Y3 


Y4 


Ys 


Xi 


100 


0 


0 


0 


0 


X 2 


0 


200 


0 


0 


0 


X 3 


0 


0 


0 


0 


100 


X 4 


0 


0 


0 


100 


0 


X 5 


0 


0 


200 


0 


0 



Wenn eine solche Kreuztabelle vorliegt, messen alle hier vorge- 
stellten Maße „falsch“. Denn alle Maße würden Werte kleiner als 1 
angeben, d.h. sie würden anzeigen, dass ein geringer Zusammen- 
hang zwischen beiden Merkmalen besteht. Tatsächlich besteht 
aber ein perfekter Zusammenhang, denn jeder Kategorie des einen 
Merkmals ist genau eine Kategorie des anderen Merkmals zuge- 
ordnet. Nur ist dieser Zusammenhang nicht monoton, d.h. immer 
wenn sich ein Paar in einem Merkmal in einer Richtung unter- 
scheidet, kann man diesen Unterschied nicht in derselben Richtung 
auf das andere Merkmal übertragen, sondern er ist je nach gewähl- 
ter Kategorie verschieden. Man spricht hier allgemein von einem 
nichtlinearen Zusammenhang: 
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Definition-. Monotoner bzw. linearer Zusammenhang von 

ordinalen Merkmalen bedeutet, dass bzgl. aller ihrer Kategorien 
dieselbe Art des Zusammenhangs besteht. 

Nichtlinearer Zusammenhang bedeutet, dass die Art des Zu- 
sammenhangs zwischen den Merkmalen auch von den jeweili- 
gen Kategorien abhängt. 



Werden die letzten drei Kategorien in der obigen Kreuztabelle 
zusammengelegt, so bleibt völlig verborgen, dass hier ein nichtli- 
nearer, perfekter Zusammenhang besteht, weil dann nur noch Wer- 
te entlang der Diagonalen erscheinen. Eine Verkleinerung der 
Kategorienanzahl kann also dazu führen, dass nichtlineare Zu- 
sammenhänge schwerer erkannt werden können. 

Das Problem des Bestehens und Erkennens nichtlinearer Zu- 
sammenhänge ist kein spezielles Problem von Rangkorrelations- 
maßen, sondern wird im Gegenteil für Zusammenhangsmaße von 
intervallskalierten Daten verschärft auftreten. Fast alle herkömmli- 
chen statistischen Zusammenhangsmaße beruhen auf der Annah- 
me, dass die Zusammenhänge zwischen den untersuchten Merk- 
malen monoton sind. Man spricht deshalb auch von einem linearen 
Modell, das diese Maße unterstellen. Wenn die Daten tatsächlich 
eine U-förmige Beziehung aufweisen wie in diesem Beispiel, so 
stellen auf der meist nicht hinterfragten Grundlage dieses linearen 
Modells die Maße einfach einen weniger starken Zusammenhang 
fest. Die Maße können deshalb nur im Rahmen der Unterstellung 
eines monotonen Zusammenhangs richtig interpretiert werden; sie 
können selbst keinen Hinweis auf Nichtlinearität der Zusammen- 
hänge geben. 

Die Entscheidung darüber, ob bei einer Datenstruktur wie 
oben ein geringer monotoner Zusammenhang oder ein perfekter U- 
förmiger Zusammenhang festgestellt wird, liegt deshalb allein bei 
den Forschern. Sie muss sich aus inhaltlichen Überlegungen erge- 
ben. Beim Beispiel des Zusammenhangs Schulbildung - politi- 
sches Interesse wäre z.B. die Frage zu beantworten, ob es Gründe 
dafür gibt, dass mit immer höherer Schulbildung das Interesse an 
Politik wieder abnimmt, z.B. weil dadurch grundsätzlich andere 
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Beschäftigungen einen Stellenwert gewinnen, die das Interesse an 
Politik mindern. Das könnte man sich z.B. für Gesellschaften vor- 
stellen, in denen als höchstes Bildungsgut eine esoterische bzw. 
religiöse Schulung gilt. 

11.7.2 Der Einfluss von Drittvariablen. 

Neben der Beziehungsform gibt es einen zweiten wichtigen Grund, 
der dazu führen kann, dass die Maße zu einer Fehlinterpretation 
führen. Das ist der Einfluss von einem weiteren, dritten Merkmal. 
Als Beispiel dafür folgen SPSS-Berechnungen mit Daten des 
ALLBUS 1994. Die beiden ersten Merkmale sind das Alter (V247 
im ALLBUS 1994) in drei Kategorien jung, mittel und älter, und 
die Zustimmung zu der Behauptung: „Hausfrau sein ist genauso 
erfüllend wie gegen Bezahlung zu arbeiten“ (V360) in den drei 
Kategorien „Stimme zu“, „weder noch“ und „Stimme nicht zu“. 
Die dahinter stehende Vermutung ist, dass sich gerade bei den 
Frauen in Bezug auf die Erfüllung durch das Hausfrauendasein in 
den letzten beiden Generationen viel verändert hat. Die entspre- 
chende Kreuztabelle für die befragten Frauen insgesamt zeigt eine 
entsprechende Besetzung der Diagonale (von links unten nach 
rechts oben), aber die Maße sind niedrig bei etwa 0,2. Sie zeigen 
immerhin das erwartete Vorzeichen: je älter die Frauen sind, desto 
eher stimmen sie der Behauptung zu (Tabelle 1 1.3). 
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Tabelle 11.3: Zusammenhang zwischen Alter und Zustimmung zum 
„Hausfrauen-Dasein “ bei Frauen 



Anzahl 





1 Erfüllendes Hausfrauenarbeit 


Gesamt 


Stimme zu 


weder noch 


Lehne ab 


ALT3 jung 


119 


58 


239 


416 


mittel 


197 


63 


404 


664 


alt 


308 


56 


182 


546 


Gesamt 


624 


177 


825 


1626 



Richtungsmaße 





Wert 


Asymptoti 

scher 

Standardf 

ehler 


Näherung 
sweises T 


Näherung 

sweise 

Signifikanz 


Somers-d Symmetrisch 








,000 


Alter abhängig 
Erfüllendes 


-,219 


,023 


-9,402 


,000 


Hausfrauenarbeit 

abhängig 


-,195 


,021 


-9,402 


,000 



Symmetrische Maße 







Wert 


Asymptoti 

scher 

Standardf 

ehler 


Näherung 
sweises T 


Näherung 

sweise 

Signifikanz 


Ordinal- bzgl. 


Kendall-Tau-b 








,000 


Ordinalmaß 


Kendall-Tau-c 


-.191 


,020 


-9,402 


,000 


Gamma 

Anzahl der gültigen Fälle 


-,324 

1626 


,033 


-9,402 


,000 



Wenn dieser geringe Zusammenhang auf den Einfluss einer dritten 
Variablen zurückzuführen ist, welche könnte das sein? Seit den 
Bildungsreformen der 1970er Jahre hat sich das durchschnittliche 
Bildungsniveau der Frauen stark erhöht, so dass dieser Einfluss 
kontrolliert werden sollte. Es werden deshalb jetzt nur diejenigen 
Frauen mit mindestens Fachhochschulreife ausgewählt (Tabelle 
11.4). 
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Tabelle 11.4: Zusammenhang zwischen Alter und Zustimmung zum 
„ Hausfrauen-Dasein “ bei Frauen mit mindestens Fachhochschul- 
reife 



Anzahl 





j Erfüllendes Hausfrauenarbeit 


Gesamt 


Stimme zu 


weder noch 


Lehne ab 




25 


17 


67 


109 




18 


16 


82 


116 




17 


2 


18 


37 




60 


35 


167 


262 



Richtungsmaße 





Wert 


Asymptoti 

scher 

Standardf 

ehler 


Näherung 
sweises T 


Näherung 

sweise 

Signifikanz 


Somers-d Symmetrisch 








IS 


Alter abhängig 
Erfüllendes 


■ 


,067 




m 


Hausfrauenarbeit 

abhängig 


-,032 


,057 


-.566 


,571 



Symmetrische Maße 







Wert 


Asymptoti 

scher 

Standardf 

ehler 


Näherung 
sweises T 


Näherung 

sweise 

Signifikanz 


Ordinal- bzgl. 


Kendall-Tau-b 


-,035 




-,566 


,571 


Ordinalmaß 


Kendall-Tau-c 


-,030 




-,566 


,571 


Gamma 

Anzahl der gültigen Fälle 


-,060 

262 


,106 


-,566 


,571 



Die Kreuztabelle für diese Teilgruppe zeigt nun keine besondere 
Besetzung der Diagonalen mehr und die Maße sind alle nicht sig- 
nifikant. Das bedeutet, dass für diese Frauen überhaupt kein Zu- 
sammenhang zwischen ihrem Alter und der Zustimmung zum 
Hausfrauendasein besteht. Es ist also nach diesem Befund so, dass 
sich nicht die generelle Zustimmung der Frauen zum Hausfrauen- 
dasein in den letzten zwei Generationen verändert hat, sondern 
dass diese Änderung nur mit der höheren Bildung der jüngeren 
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Frauen zusammenhängt. Nicht, weil die Frauen jünger sind, haben 
sie eine andere Meinung zum Flausfrauendasein, sondern weil sie 
eine bessere Schulbildung haben. 



Weitere Literatur zu diesem Kapitel: Clauß u.a.:77 - 81, Hoch- 
städter 151 - 161, Blalock 436-447, Liebetrau, Kühnel/Krebs: 366- 
378 



Übungsaufgaben : 

1 . In einer Studie zur Lesefähigkeit von Schulkindern wurde nach 
der Dauer des täglichen Fernsehkonsums gefragt. Die folgende 
Tabelle enthält die Werte für Vielseher (= mehr als 3 Std. Fernse- 
hen pro Tag) und Wenigseher (= weniger als 1 Std. Fernsehen pro 
Tag). 



Fernseh- 

konsum 


gering 


Lesefä- 

higkeiten 

mittel 


hoch 


Summe 


Wenigseher 


2 


5 


1 


14 


Vielseher 


8 


13 


5 


26 


Summe 


10 


18 


12 


40 



a) Berechnen Sie Gamma. 

b) Unter der Annahme, dass die Auswahl der Kinder eine Stich- 
probe darstellt, soll geprüft werden, ob ein Zusammenhang auch in 
der Grundgesamtheit besteht, für ein Niveau von 95% und 99% 
Sicherheit. 





Kapitel 12: Korrelation und Regression 



In diesem Kapitel werden Zusammenhangsmaße für zwei metri- 
sche Merkmale behandelt. Bei den Zusammenhangsmaßen für 
kategoriale Daten aus den vorangehenden Kapiteln gab es eine 
Reihe von verschiedenen Maßen, unter denen, je nach dem Er- 
kenntnisinteresse, eine Auswahl getroffen werden musste. Dieses 
Problem entfällt bei metrischen Daten, hier gibt es nur die zwei 
Maße Korrelation r und Determinationskoeffizient R\ die eine 
ähnliche inhaltliche Interpretation besitzen. 



12.1 Die Beispiel-Daten 

Als Beispiel soll im Folgenden der Zusammenhang zwischen der 
Ausbildungsdauer in Schule und Hochschule und der „subjektiven 
Schichteinstufung“, der Zuordnung der eigenen Person zu einer 
von fünf sozialen Schichten, untersucht werden (Tabelle 12.1). 
Gründe, weshalb diese beiden Variablen Zusammenhängen, lassen 
sich mehrere vorstellen. Je länger die Ausbildung dauert, desto 
höher werden einerseits die Bildungsabschlüsse; und mit höherem 
Bildungsabschluss steigt auch das Einkommen und die berufliche 
Position, so dass auch die tatsächliche Schichtzugehörigkeit steigt, 
die wiederum subjektiv richtig wahrgenommen wird. Weiter steigt 
mit der Länge der Ausbildungsdauer auch der Grad des Wissens 
und der Bildung und damit die Teilnahme an kulturellen, politi- 
schen und gesellschaftlichen Aktivitäten, die zum größeren Teil 
von Personen aus den höheren Schichten besucht werden, zu de- 
nen man sich dann subjektiv zugehörig fühlen kann. 



V. Müller-Benedict, Grundkurs Statistik in den Sozialwissenschaften, 

DOI 10. 1007/978-3-53 1-93225-5_12, ©VS Verlag für Sozialwissenschaften | 
Springer Fachmedien Wiesbaden GmbH 2011 
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Tabelle 12.1: Subjektive Schichteinstufung und Anzahl der schuli- 
schen Ausbildungsjahre 



SUBJEKTIVE SCHICHTEINSTUFUNG, BEFR. 





Häufigkeit 


Gültige 

Prozente 


Kumulierte 

Prozente 


Gültig 


UNTERSCHICHT 


70 


2,1 


2,1 




ARBEITERSCHICHT 


1130 


33,8 


35,9 




MITTELSCHICHT 


1788 


53,5 


89,5 




OBERE MITTELSCHICHT 


281 


8,4 


97,9 




OBERSCHICHT 


16 


,5 


98,4 




KEINER DER 
SCHICHTEN 


55 


1,6 


100,0 




Gesamt 


3340 


100,0 





DAUER DER SCHULAUSBILDUNG IN JAHREN 





Häufigkeit 


Gültige 

Prozente 


Kumulierte 

Prozente 


Gültig 5 


9 


,3 


,3 


6 


12 


,4 


,6 


7 


50 


1,5 


2,2 


8 


1117 


34,1 


36,3 


9 


403 


12,3 


48,6 


10 


879 


26,9 


75,5 


11 


122 


3,7 


79,2 


12 


165 


5,0 


84,2 


13 


141 


4,3 


88,5 


14 


47 


1,4 


90,0 


15 


60 


1,8 


91,8 


16 


75 


2,3 


94,1 


17 


78 


2,4 


96,5 


18 


42 


1,3 


97,8 


19 


31 


,9 


98,7 


20 


25 


,8 


99,5 


21 


8 


,2 


99,7 


22 


6 


,2 


99,9 


23 


1 


,0 


99,9 


25 


2 


,1 


100,0 


Gesamt 


3273 


100,0 
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Durch den längeren Aufenthalt im Bildungssystem kann zuletzt 
auch die eigene Selbsteinschätzung als gebildeter Mensch zum 
subjektiven Gefühl der höheren Schichtzugehörigkeit führen. 

Man kann also einen positiven Zusammenhang vermuten: je 
länger die Ausbildungsdauer, desto höher die subjektive Schicht- 
einstufung. Beide Variablen werden als metrisch angesehen. Bei 
der Ausbildungsdauer, die in Jahren gemessen wird, ist das un- 
problematisch, bei der Schichteinteilung in 5 Stufen: Unterschicht 
(Code: 1), Arbeiterschicht (2), Mittelschicht (3), obere Mittel- 
schicht (4) und Oberschicht (5), ist das dadurch zu rechfertigen, 
dass diese Begriffe selbst ein Kontinuum von Schichten etwa glei- 
cher Abstände nahe legen. Um die Veränderung in der Schichtein- 
teilung für jede Zahl von Ausbildungsjahren deutlicher hervortre- 
ten zu lassen, wird hier zunächst der Durchschnitt (Mittelwert) der 
subjektiven Schichteinstufung für jede Anzahl von Ausbildungs- 
jahren berechnet. So entsteht ein neuer Datensatz mit zwei metri- 
schen Merkmalen von nur noch je 20 Fällen, der Ausbildungsdau- 
er und der dazugehörigen durchschnittlichen subjektiven Schicht- 
einstufung (s. Tabelle 12.2, Spalte 1 und 2): 
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Tabelle 12.2: Ausbildungsdauer und durchschnittliche subjektive 
Schichteinstufung und daraus berechnete Werte 



1 


2 


3 


4 


5 


Ausbil- 


Durch- 


Schuljahre x 


subj. Schicht 


Spalte 3 


dungsjahre 


schnittl. 


- 


y - 


x 


X 


subj. Schicht y 


Mittelwert(x) 


Mittelwert(y) 


Spalte 4 


5 


2,4286 


-9,5500 


-0,5849 


5,5861 


6 


2,1667 


-8,5500 


-0,8468 


7,2404 


7 


2,2500 


-7,5500 


-0,7635 


5,7644 


8 


2,4762 


-6,5500 


-0,5373 


3,5191 


9 


2,6146 


-5,5500 


-0,3989 


2,2140 


10 


2,6463 


-4,5500 


-0,3672 


1,6706 


11 


2,8609 


-3,5500 


-0,1526 


0,5418 


12 


2,9103 


-2,5500 


-0,1032 


0,2630 


13 


3,1290 


-1,5500 


0,1155 


-0,1791 


14 


3,0233 


-0,5500 


0,0098 


-0,0054 


15 


2,8696 


0,4500 


-0,1439 


-0,0648 


16 


3,0476 


1 ,4500 


0,0341 


0,0495 


17 


3,2388 


2,4500 


0,2253 


0,5520 


18 


3,3243 


3,4500 


0,3108 


1,0723 


19 


3,5517 


4,4500 


0,5382 


2,3951 


20 


3,5652 


5,4500 


0,5517 


3,0069 


21 


3,5000 


6,4500 


0,4865 


3,1379 


22 


3,6667 


7,4500 


0,6532 


4,8661 


23 


3,0000 


8,4500 


-0,0135 


-0,1141 


24 


4,0000 


10,4500 


0,9865 


10,3089 


Summe 








51,82 



Aus den Spalten 1 und 2 erhält man folgendes Streudiagramm: 
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0 10 20 30 

DAUER DER SCHULAUSBILDUNG IN JAHREN 



Abbildung 12.1: Streudiagramm Ausbildungsdauer vs. durchschnittliche subjektive 
Schichteinstufung 



12.2 Die Korrelation r 

Als ersten Weg, den Zusammenhang in eine Zahl zu fassen, wird 
das Ausmaß beschrieben, in dem die eine Variable variiert, wenn 
die andere Variable verändert wird, also das Ausmaß, in dem sie 
kovariieren. Das ist die fünfte Möglichkeit der Beschreibung für 
„Zusammenhang“ (s. Kap. 10.1). Als ein Maß dafür wurde früher 
(Kap. 6.6) die Kovarianz definiert: 

1 n 

S xy = 7I7X (Xi “^ (yi “^ 

n 1 i=i 

Der Wert der Kovarianz beträgt für die obigen Daten 51,82/19 = 
2,7274 (Berechnung nach der Formel s. Spalten 3, 4 und 5 der 
Tabelle 12.2). 
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Sie ist zunächst positiv (s xy > 0) und zeigt damit an, dass die 
Vermutung stimmt: je länger die Ausbildungsdauer, desto höher 
die subjektive Schichteinstufung. Das Problem bei der Kovarianz 
ist, dass ihre Größe von der Größe der Ausprägungen und ihrer 
Streuungen abhängt. Wird z.B. die Ausbildungsdauer in Monaten 
gemessen statt in Jahren, steigt ebenfalls die Kovarianz um den 
Faktor 12 2 = 144. 

Die Frage, wie man den Zusammenhang zweier Variablen 
unabhängig von ihrer Größenordnung beschreiben kann, führt auf 
folgende Überlegungen: Die beiden Variablen haben 

unterschiedliche Größenordnungen, hier zwischen 2 und 4 
(durchschnittliche subjektive Schichteinstufung) bzw. 5 und 25 
(Ausbildungsjahre). Und ihre Streuung kann ebenfalls verschieden 
groß sein. Deshalb ist der erste Schritt bei der Entwicklung eines 
von den absoluten Werten der Variablen unabhängigen Maßes, 
beide Variablen erst zu standardisieren, bevor man ein 
Zusammenhangsmaß definiert. Was geschieht dann? Abbildung 
12.2 zeigt diese Veränderung: 



II II 

x: 

1 


i 

■ 

■ 

_ ■ 


■ ■ 

■■ 

u u 


■ 



- 2-1012 
Z-Wert: Dauer der Schulausbildung 



Abbildung 12.2: Streudiagramm der standardisierten Variablen mit den Rechtecken 
zu zwei Fällen mit negativem bzw. positivem Produkt x^-y, 2 



In der Grafik ändert sich nur die Bezeichnung der Achsen, weil 
beide Variablen jetzt gleichmäßig mit derselben mittleren Abwei- 
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chung von 1 um den Mittelpunkt (0,0) streuen. Der Zusammen- 
hang beider Variablen, sichtbar als „Gestalt“ der Punktwolke, 
ändert sich nicht. Die neuen standardisierten Werte x, 7 , y, 7 sind 
durch die Standardisierung auf beiden Achsen gleich skaliert. 

Der stärkste Zusammenhang, d.h. der größte absolute Betrag 
der Kovarianz beider Merkmale wird dann erreicht, wenn alle 
Punkte genau auf einer der beiden Diagonalen durch den Ursprung 
liegen. Denn weil beide Variablen jetzt gleich skaliert sind und 
auch dieselbe Streuungsbreite haben, ist der Zusammenhang bei- 
der Variabler umso stärker, je mehr sich die Abweichungen jedes 
Falles i von Null, Xj und y,, gleichen. 

Wenn alle Wertepaare auf einer Diagonalen liegen, dann ent- 
spricht jeder Abweichung vom Mittelwert in der einen Variable 
eine (im Verhältnis der beiden Streuungen) genau gleiche Abwei- 
chung vom Mittelwert in der anderen Variable, d.h. beide Variab- 
len variieren immer zusammen in dieselbe Richtung mit derselben 
Stärke. 

Beim maximalen positiven Zusammenhang liegen also alle 
Wertepaare entlang der Diagonalen von links unten nach rechts 
oben. Es gilt dann y ; = x, für alle i wegen der Standardisierung. 
Dann hat die Kovarianz der standardisierten Werte den Wert + 1 
oder - 1 : 

(l/(n-l))2>j'yf =s x z y z =S x z x z =S x z =1 
i=1 

weil y ; = x, gilt und x standardisiert und deshalb die Standardab- 
weichung s x 2 = 1 ist (s. Kap. 6.3). Wenn man also definiert: 



n 

r = (1/n-l) J]xfyf 

i=l 

dann erfüllt r die Anforderungen an ein Maß für den Zusammen- 
hang von zwei Variablen: Es wird 0, wenn kein Zusammenhang 
besteht, 1 oder -1 für perfekten positiven oder negativen Zusam- 
menhang, und nimmt sonst nur Werte dazwischen an. r heißt die 
Korrelation. Sie wird meist mit den folgenden zwei weiteren For- 
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mein angegeben, die aber nach Umformungen mit der obigen 
identisch sind (der Faktor l/(n-l) im Zähler kürzt sich jeweils 
gegen denselben Faktor im Nenner heraus): 

Definition : Die Korrelation (Pearson-Bravais- oder Produkt- 
Moment-Korrelationskoeffizient) zwischen zwei metrischen 
Merkmalen ist: 
n 



y,(x i -x)(y i -y) 




a) extrem positive b) stark positive c) schwach positive 
Korrelation Korrelation Korrelation 




d) Korrelation e) negative f) extrem negative 

nahe Null Korrelation Korrelation 




Abbildung 12.3: Punktwolken im Streudiagramm für verschiedene Werte von r 
(Clauß u.a.: 66) 

Wie Punktwolken für verschiedene Werte von r aussehen können, 
zeigt die Abbildung 12.3. 
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Für die Berechnung der Korrelation zwischen den beiden Bei- 
spiel-Variablen werden die Standardabweichungen benötigt: 







Standardab 




N 


weichung 


Schulausbildung in 
Jahren 


20 


6,00 


subjektive Schicht 
(Mittelwert) 


20 


,4959 



Zusammen mit Spalte 5 der Tabelle 12.2, in der die Summe der 
zentrierten Produkte steht, ergibt sich: 

r = s xy / s x Sy = (51,82/19) / (6,00 ■ 0,4959) = 0,9166 

Da der Maximalwert 1 ist, liegt also eine recht hohe Korrelation 
vor. Andererseits gibt es auch nur wenige Daten, nämlich 20, so 
dass zu erwarten ist, dass der Zufall noch einen großen Einfluss 
hat, weil nicht, wie bei einer großen Fallzahl, ein Ausgleich von 
positiven und negativen Abweichungen stattfinden kann. Um ab- 
zuschätzen, ob diese Höhe der Korrelation signifikant vom Zufall 
abweicht, muss deshalb wieder eine Tabelle der zufälligen Vertei- 
lung von r herangezogen werden, in der diejenigen Werte von r 
eingetragen sind, die höchstens von (l-a)lOO % der Stichproben 
durch Zufall erreicht werden, also die oberen Grenzen des Konfi- 
denzintervalls für r = 0 (Tabelle 12.3). Wenn der empirisch ermit- 
telte r-Wert dem Betrag nach darüber liegt, ist er signifikant. 

Die „Freiheitsgrade“ für r, die in dieser Tabelle benötigt wer- 
den, haben den Wert n - 2, wenn n = Anzahl der Fälle ist (durch 
die beiden Standardabweichungsberechnungen im Nenner gehen 2 
„freie“ Variationen der Daten verloren). Wie man sieht, kann r 
durch reinen Zufall recht hoch werden, wenn es von geringen 
Fallzahlen berechnet wird: Für n = 20, wie im Beispiel, also für 18 
Freiheitsgrade, dürfen erst Werte ab etwa 0,46 als signifikanter 
Zusammenhang interpretiert werden (0,46 ermittelt als „Interpola- 
tion“ für 18 Freiheitsgrade zwischen 0,42 für 20 Freiheitsgrade 
und 0,48 für 15 Freiheitsgrade in der Tabelle 12.3). 
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Tabelle 12.3: „Zufallshöchstwerte“ von r (Clauß u.a.:407) 



Freiheilsgrade 


Imumswahrscheinlichkeit a 


5% 


1% 


0,27% 


0,1% 


Zufallshöchstwerte von r 


5 


0,75 


0,87 


0,93 


0,95 


10 


0,58 


0,71 


0,78 


0.82 


15 


0,48 


0,61 


0,68 


0,72 


20 


0,42 


0.53 


0,61 


0,65 


25 


0,38 


0,49 


0.55 


0.60 


30 


035 


0.45 


031 


035 


35 


0,32 


0,42 


0,48 


0,52 


40 


0,30 


0.39 


0,45 


0.49 


50 


037 


0.35 


0,41 


0,44 


60 


0.25 


0.33 


0.37 


0,41 


70 


0.23 


0.30 


0,35 


0.38 


80 


0,22 


0,28 


0,33 


0,36 


90 


031 


036 


0,31 


0.34 


100 


0,19 


035 


0.29 


032 


120 


0,18 


033 


0.27 


0.30 


ISO 


0.16 


031 


0.24 


036 


200 


0.14 


0,18 


0,21 


033 


300 


0,11 


0.15 


0,17 


0,19 


400 


0.10 


0.13 


0,15 


0.16 


500 


0.09 


0.11 


0,13 


0.15 



Das Ergebnis einer Korrelationsberechnung in SPSS zeigt 
Tabelle 12.4: 

Tabelle 12.4: Korrelationsausgabe in SPSS 

Korrelationen 





Schulausbild 
ung in 
Jahren 


subjektive 

Schicht 

(Mittelwert) 


Schulausbildung in 


Korrelation nach Pearson 


1,000 


,916 


Jahren 


Signifikanz (2-seitig) 


, 


,000 




N 


20 


20 


subjektive Schicht 


Korrelation nach Pearson 


,916 


1,000 


(Mittelwert) 


Signifikanz (2-seitig) 


,000 


, 




N 


20 


20 
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12.3 Die Regressionsgerade 

Als zweite Möglichkeit für die Berechnung des Zusammenhangs 
diene wieder die Verbesserung der Vorhersagequalität der ersten 
Variable, wenn Informationen über die zweite Variable herange- 
zogen werden, also ein PRE-Maß (s. Kap. 10.5). Um die Verbesse- 
rung der Vorhersagequalität messen zu können, muss zunächst ein 
Maß für die Vorhersagegüte definiert werden. Als ein solches Maß 
dienen die bekannten Abstandsquadrate, die schon für die Defini- 
tion der Streuung benutzt worden sind. 

Die erste Variable x sei die unabhängige Variable, die die 
zweite, abhängige Variable y beeinflusse. Wenn man nichts über 
die Ausprägung der unabhängigen Variable weiß, was sollte dann 
für die abhängige Variable vorhergesagt werden, wenn die Vorher- 
sagegüte als Abstandsquadrat gemessen wird? Man wird für jeden 
Fall genau den Mittelwert Vorhersagen, weil dann die Summe über 
alle Fehler, die man macht, genau die Summe der Abstandsquadra- 
te ist, und die ist minimal gegenüber allen anderen Vorhersagen 
(Kap. 6.3). Der Referenzwert, auf den sich jede Verbesserung der 
Vorhersage durch Hinzunahme der unabhängigen Variable be- 
zieht, ist also die Summe der Abstandsquadrate 

n 

SAQ y =£ (yi -y ) 2 

i=l 

= Vorhersagefehler ohne Berücksichtigung von X 

Einer dieser Abstände ist in Abbildung 12.4a eingezeichnet. 

Wie kann man nun die Vorhersage verbessern, indem die un- 
abhängige Variable einbezogen wird? Wenn die Mittelwertlinie 
etwas gekippt wird, kann man offenbar gleichzeitig alle einge- 
zeichneten Abstände verkleinern. Wenn man allerdings zu weit 
kippt, werden die Abstände wieder größer. Das Verfahren wäre 
also, eine Gerade zu finden, bei der die eingezeichneten Abstands- 
quadrate in ihrer Summe gerade minimal werden (Abbildung 
12.4b). 
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Schulausbildung in Jahren 



Abbildung 12.4a: Mittelwert als Referenz für die Residuen 




Schulausbildung in Jahren 

Abbildung 12.4b: Regressionsgerade als Referenz für Residuen 



Dazu muss die allgemeine Definition einer Gerade in einem Koor- 
dinatensystem herangezogen werden. Sie lautet: 
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Definition: Eine Gerade ist definiert durch die Formel 

y = a + bx 

a heißt der Achsenabschnitt, b die Steigung. 



Steigt x um 1, so steigt y um b. Je größer b ist, desto steiler ist die 
Gerade; genauer ist b der Tangens des Steigungswinkels. Wenn 
eine solche Gerade y = a + bx mit kleinstem „Abstand“ zu den 
Punkten des Streudiagramms gefunden worden ist, dann kann für 
jeden Wert der unabhängigen Variablen x, eine Schätzung y, 
anstelle des tatsächlichen y ; angegeben werden, indem man X; in 
die Gleichung der Geraden einsetzt (das A über dem y steht für 
einen aus einem mathematische Modell, hier einer Geraden, ge- 
schätzten y-Wert) : 

a i 

yi = a + b x ; 

Mit diesen Schätzwerten erhält man entsprechend als Maß für die 
Güte der Vorhersage unter Einbeziehung der unabhängigen Vari- 
ablen 

n n 

sAQy = X ( yi-yi) 2 = Z ( y >- (a+bx ‘ ))2 

i=l i=l 

= Vorhersagefehler mit Berücksichtigung von X 

Mit den Mitteln der Differentialrechnung lassen sich nun die Wer- 
te für diejenige Gerade, die diese Abweichungen minimiert, be- 
rechnen: 



Die Abweichungsquadrate von der Regressionsgeraden werden 
genau dann minimal, wenn b und a folgende Werte haben: 

SAQy = 2 (Yi “ Vi ) 2 = Z ( y i “ 0 + bx ; )f = Min! 

i=1 i=1 



<=> b = 




a = y-bx 
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Definition : Die Gerade y = a + bx mit diesen Werten heißt Reg- 
ressionsgerade und a und b die Regressionskoeffizienten. 



Die Abbildung 12.4b zeigt die Regressionsgerade für die Beispiel- 
Daten. SPSS gibt folgende Werte aus für die Daten aus Tabelle 
12.2, Spalte 1 und 2: 



Koeffizienten 









Standardi 












siede 








Nicht standardisierte 


Koeffizien 








Koeffizienten 


ten 










Standardf 








Modell 


B 


ehler 


Beta 


T 


Signifikanz 


1 (Konstante) 


1,913 


,122 




15,626 


,000 


Schulausbildung 
in Jahren 


,076 


,008 


,916 


9,695 


,000 



Der Wert für a wird dort mit „Konstante“ bezeichnet und beträgt 
1,913, und der Wert für b ist 0,076. Damit ergibt sich als Formel 
für die Regressionsgerade: 
y ; = 1,913 + 0,076 x; 

Mit ihr kann man alle Schätzwerte y , berechnen, z.B. 
y,= 1,913 + 0,076-5 =2,293 
y 2 = 1,913 + 0,076-6 = 2,369 

In den folgenden Spalten der SPSS-Tabelle wird u.a. der Standard- 
fehler für den Wert b, mit dem man ein Konfidenzintervall für b 
berechnen kann, und die Signifikanz von b ausgegeben. Wie für 
die in den vorigen Kapiteln besprochenen Maße üblich, bedeutet 
der Wert der Signifikanz in der letzten Spalte die Fehlerwahr- 
scheinlichkeit bzw. das a-Niveau, zu dem b gerade noch signifi- 
kant von 0 verschieden ist. Hier ist a < 0,000... und damit b ganz 
sicher größer als 0, was gleichbedeutend damit ist, dass die festge- 
stellte Steigerung der durchschnittlichen subjektiven Selbstein- 
schätzung durch längere Ausbildung auf die Grundgesamtheit aller 
Deutschen übertragbar ist. 
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12.4. Der Determinationskoeffizient 

Wenn man mit diesen Formeln eine Regressionsgerade berechnet 
hat, kann man damit die Vorhersage der abhängigen Variablen aus 
den Werten der unabhängigen beträchtlich verbessern. Die folgen- 
de Abbildung 12.5 zeigt das Residuum eines yy-Wertes, seinen 
Abstand vom Mittelwert insgesamt, als Summe des Abstands des 
geschätzten Werts y ; vom Mittelwert und des Abstands von y, von 
yi. Die Abweichung eines Wertes y, vom Mittelwert lässt sich auf 
diese Weise zerlegen in einen durch die Regressionsgerade „vor- 
hersagbaren“ Teil und die dann noch verbleibende Abweichung, 
den unerklärten Rest (s.a. Abbildung 12.5): 

(Yi - y) = (Yi - Yi) + (Yi - y) 




Abbildung 12.5: Residuenzerlegung (Blalock:407) 



Die Fehler der Vorhersage, d.h. Abstände der vorherge sagten zu 
den tatsächlichen Datenpunkten, verkleinern sich offenbar durch 
die konstruierte Regressionsgerade. Was geschieht nun, wenn man 
nicht nur einen Datenpunkt, sondern die Summen der Abstands- 
quadrate betrachtet? Hier ergibt sich dasselbe Resultat. Wenn man 
nämlich ausrechnet 




254 



X^-^ 2= Z ((y ‘“^ )+( yi-y ))2 = 

i=l i=l 

n n n 

Z (Yi - y ; ) 2 + 2 Z ( y i - y i )( y i - y ) + Z (y > ~ y)2 

i=l i=l i=l 

ergibt sich, dass der mittlere Summand immer Null ist (Beweis: 
Hochstaedter:135), so dass am Ende folgende Formel steht: 

Z(y.-y) 2 = Z ( y 1 -y 1 ) 2+ Z ( y>~y )2 

i=l i=l i=l 



SAQy — S AQ n i C | 1 t_ er uärt "t - SAQ er uärt 
Totale Summe Abstandsquadrate = 

nicht-erklärte Abstandsquadrate + erklärte Abstandsquadrate 

Mit Hilfe dieser Zerlegung wird nun eine weitere Maßzahl R 2 , 
der Determinationskoeffizient, definiert. Er misst die Verbesse- 
rung der Vorhersage durch die Regressionsgerade als Anteil der 
aufgeklärten SAQ. 



Definition : Der Determinationskoeffizient R 2 ist definiert als 

p i SAQ eMM SAQ y -SAQ„, tlM 
SAQ, SAQ, 



Wenn in der Zerlegungsformel alle Terme durch (n-1) dividiert 
werden, steht auf der linken Seite die Varianz s y 2 = SAQ y /(n-l). 
Deshalb spricht man bei dieser Formel auch von einer Zerlegung 
der Varianz in einen durch die Vorhersage erklärten Teil und einen 
nicht-erklärten Teil. Das Maß R 2 hat deshalb die folgende inhaltli- 
che Interpretation: es ist der Anteil der Streuung in der abhängigen 
Variablen, gemessen mit der Varianz, der durch einen linearen 
Zusammenhang der beiden Variablen erklärt werden kann, es ist 
der „Anteil erklärter Varianz“. 
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Die Berechnung von R 2 für die Beispiel-Daten geht wie folgt: 
zunächst müssen die “Residuen”, die Abstände, die durch die 
Regressiongerade nicht erklärt werden, berechnet werden. Der 
erste geschätzte Wert, y,, wurde oben berechnet: y, = 2,293; dieser 
Werte und die folgenden geschätzten Werte stehen in Spalte 3 der 
folgenden Tabelle 12.5. Der tatsächliche erste y-Wert ist 2,4286. 
Das bedeutet, der erste Abstand von der Regressionsgeraden ist 
yi — yi = 2,486 - 2,293 = 0,1356. Genau diese Residuen stehen für 
alle Fälle i in der Spalte 4 der Tabelle 12.5. Dann müssen diese 
Werte quadriert werden. Diese Werte stehen in der Spalte 5. Die 
Summe der Spalte 5 ist dann genau die Summe der 
Abstandsquadrate, die nicht erklärt sind, also 



SAQnicht-erklärt - 0,7510 



Tabelle 12.5: Berechnung der nicht erklärten SAQ 



1 


2 


3 


4 


5 


Schuljahre 


Durchschnittl. Regression 
subj. Schicht subj. Schicht 


Residuen 


nicht erklärte 
Abst.quadr. 


5 


2,4286 


2,2930 


0,1356 


0,0189 


6 


2,1667 


2,3690 


-0,2023 


0,0400 


7 


2,2500 


2,4422 


-0,1922 


0,0370 


8 


2,4762 


2,5179 


-0,0417 


0,0017 


9 


2,6146 


2,5936 


0,0210 


0,0004 


10 


2,6463 


2,6692 


-0,0229 


0,0005 


11 


2,8609 


2,7449 


0,1160 


0,0135 


12 


2,9103 


2,8206 


0,0898 


0,0081 


13 


3,1290 


2,8962 


0,2328 


0,0542 


14 


3,0233 


2,9719 


0,0514 


0,0026 


15 


2,8696 


3,0475 


-0,1780 


0,0317 


16 


3,0476 


3,1232 


-0,0756 


0,0057 


17 


3,2388 


3,1989 


0,0399 


0,0016 


18 


3,3243 


3,2745 


0,0498 


0,0025 


19 


3,5517 


3,3502 


0,2015 


0,0406 


20 


3,5652 


3,4259 


0,1394 


0,0194 


21 


3,5000 


3,5015 


-0,0015 


0,0000 


22 


3,6667 


3,5772 


0,0895 


0,0080 


23 


3,0000 


3,6528 


-0,6528 


0,4262 


25 

Summe 


4,0000 


3,8042 


0,1958 


0,0384 

0,751 
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Aus der Standardabweichung s y von y, die 0,4959 beträgt (s. Kap 
12.2), lässt sich Summe der Abstandsquadrate SAQ y , das Refe- 
renzmaß zur Vorhersage Verbesserung, berechnen (s. die Definition 
der Varianz s y 2 in Kap. 6.3): 

SAQ y = s y 2 • (n-1) = 0,4959 2 • 19 = 0,2459-19 = 4,6721 

Also ist der Deterniinationskoeffizient: 

R” = (SAQy - SAQnicht-erklärt) / SAQ y 
= (4,6721 - 0,75 10)/4, 6721 = 0,839 

Das bedeutet, dass mit dieser Regressionsgerade fast 84% der 
Varianz von y erklärt werden kann. M.a.W.: die Variation der 
Mittelwerte der subjektiven Schichteinstufung wird zu knapp 84% 
dadurch erklärt, dass die durchschnittliche subjektive Schichtein- 
stufung pro weiterem Ausbildungsjahr um denselben Betrag, näm- 
lich b = 0,076, zunimmt. 

Ein so großes R 2 ist für sozialwissenschaftliche Daten unge- 
wöhnlich. Allgemein gelten, wie für die anderen Maße auch, Wer- 
te von über 0,3 als gut bestätigte Zusammenhänge, Werte von über 
0,7 als sehr gut. 

SPSS gibt den Wert von R 2 bei der Berechnung der Regressi- 
onsgeraden mit aus (in der dritten Spalte): 



Modellzusammenfassung 



Modell 


R 


R-Quadrat 


Korrigiertes 

R-Quadrat 


Standardf 
ehler des 
Schätzers 


1 


,91 6 a 


,839 


,830 


,2043 



a - Einflußvariablen : (Konstante), Schulausbildung in 
Jahren 



Bisher wurde mit den veränderten Rohdaten gerechnet, nämlich 
jeweils dem Mittelwert der subjektiven Schichteinstufung, der sich 
für alle Personen mit derselben Ausbildungsdauer ergibt. Mit den 
tatsächlichen Individualdaten, in der jede Person einzeln mit ihrer 
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subjektiven Schichteinstufung von 1 bis 5 eingeht, ergibt sich ein 
viel schwächerer Zusammenhang: 



Modellzusammenfassung 



Modell 


R 


R-Quadrat 


Korrigiertes 

R-Quadrat 


Standardf 
ehler des 
Schätzers 


1 


,375 a 


,141 


,140 


,61 



a. Einflußvariablen : (Konstante), DAUER DER 
SCHULAUSBILDUNG IN JAHREN 



Die Koeffizienten der Regressionsgerade bleiben jedoch in etwa 
gleich: 



Koeffizienten 





Nicht standardisierte 
Koeffizienten 


Standardi 

sierte 

Koeffizien 

ten 






Modell 


B 


Standardf 

ehler 


Beta 


T 


Signifikanz 


1 (Konstante) 

DAUER DER 


1,784 


,042 




42,990 


,000 


SCHULAUSBILDUNG 
IN JAHREN 


,088 


,004 


,375 


22,265 


,000 



Das Streudiagramm der individuellen Daten sieht ungewöhnlich 
aus und zeigt, dass die Schicht-Einstufungsskala nur unter Vorbe- 
halt als metrisch anzusehen ist. Denn da die Skala der subjektiven 
Schichteinstufung nur 5 Werte aufweist, können die Punkte im 
Streudiagramm, die den Ort jedes Individuums anzeigen, auch nur 
auf den zugehörigen 5 parallelen Linien liegen (Abbildung 12.6): 
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LL 

LU 

GÜ 
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o 

co 



GÜ 

=) 

CO 




DAUER DER SCHULAUSBILDUNG IN JAHREN 



Abbildung 12.6: Streudiagramm und Regressionsgerade von Ausbildungsjahren 
und subjektiver Schichteinstufung 



Der beträchtliche Unterschied zwischen dem Determinationskoef- 
fizient der Individualdaten und der oben zusammengefassten Da- 
ten demonstriert, weshalb gerade in den Sozialwissenschaften ganz 
prinzipiell keine besonders hohen Korrelationen und Determinati- 
onskoeffizienten zu erwarten sind: die individuellen Streuungen 
sind immer recht hoch, sowohl bei univariaten als auch bei bivaria- 
ten Verteilungen. Welcher Schicht man sich zugehörig fühlt, ist 
eben im realen Leben niemals nur von einer einzigen Variablen 
wie der Ausbildungsdauer, sondern von einer Vielzahl von Ein- 
flüssen abhängig, die zusätzlich ständigen Veränderungen unter- 
liegen. Aus diesem Grunde ist es für die Sozialwissenschaften 
schon ein Erfolg, wenn sie die Varianz einer abhängigen Variable 
zu 30% aufklären kann, d.h. einen Determinationskoeffizienten 
von R 2 = 0,3 erreicht. 
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12.5. Die Beziehung zwischen Korrelation r, Regressionskoeffi- 
zient b und R 2 . 

Die Korrelation wird mit r und der Determinationskoeffizient mit 
R~ bezeichnet. Es besteht im bivariaten Fall in der Tat genau diese 
Beziehung zwischen den beiden, dass der Determinationskoeffi- 
zient das Quadrat der Korrelation ist. Das soll im Folgenden kurz 
gezeigt werden. 

y ; = a + bx ; ,y = a + bx <=> y ; — y = b(x ; — x) 



«X(Yi-y ) 2 

i=i 



b 2 ^(X; -x) 2 , mit b = ^|- 
i=1 s x 



^ X ( y i _y)2 

i=i 



J xy 



, 2 2 
3 x 



2>-x) 2 



i=i 



Z ( y i - y ) 2 . 2>-*> 2 

2 _ J=l S xy j=i 

^(y.-y) 2 S x 2s x 2 ^ (y ._y } 2 

i=1 i=1 

_ S xy S x 2 (n-1) _ S xy _ r 2 
S X S X Sy (fl — 1) S x Sy 



Damit gilt die inhaltliche Interpretation des Determinationskoeffi- 
zienten R 2 als Prozentsatz der aufgeklärten Varianz ebenso für das 
Quadrat der Korrelation, r 2 . 
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12.6 Rang-Korrelation 

Es gibt ein weiteres Korrelationsmaß, das für Ordinaldaten kon- 
struiert ist, also eigentlich ein Rangkorrelationsmaß ist und in das 
vorherige Kapitel gehört. Es erscheint aber in diesem Kapitel, weil 
es wegen seiner Berechnungsmethode eher zu den hier behandel- 
ten Maßen passt. Es vergleicht nämlich die Distanz der Rangplätze 
der beiden Merkmale, die sie für jeden Fall aufweisen, und behan- 
delt diese Distanzen als metrische Abstände d: 

d ; = x t - y, mit x,, y, = Rangplatz des Merkmals X bzw. Y für Fall i 

Als Beispiel dienen Daten aus dem letzten Kapitel (11.1), die ein 
Beispiel für drei verschiedene Möglichkeiten des Zusammenhangs 
zwischen Schulbildung und politischem Interesse bieten. Schulbil- 
dung hat die Ränge 1 bis 5 (kein Abschluss bis Abitur) und politi- 
sches Interesse ebenso von 1 bis 5 (sehr wenig bis sehr viel). In 
Tabelle 12.6 sind für die drei Möglichkeiten perfekter positiver 
(Spalte 2), perfekter inverser (3) und u-förmiger Zusammenhang 
(4) die jeweiligen Rangplatzdifferenzen aufgelistet. 



Tabelle 12.6: Rangplatzdifferenzen 



Schul- 

bildung 

(1) 


Polit. 

Inter. 

(2) 


d,= 

(D- (2) 


Polit. 

Inter. 

(3) 


d,= 
(D- (3) 


Polit. 

Inter. 

(4) 


di = 

(D- (4) 


1 


1 


0 


5 


4 


1 


0 


2 


2 


0 


4 


2 


2 


0 


3 


3 


0 


3 


0 


5 


2 


4 


4 


0 


2 


2 


4 


0 


5 


5 


0 


1 


4 


3 


2 



Mit diesen Differenzen wird folgendes Maß berechnet: 
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Definition : Der Spearmansche Rangkorrelationskoeffizient r s 

ist 



r s = 1 ^ 

n(n 2 -1) 



Für die drei Zusammenhänge ergibt sich: 
r s ((1) und (2)) =1 

r s ((1) und (3)) = 1 - 6( 16+4+0+4+16)/(5(25-l)) 

= 1 - 240/120 = -1 

r s ((1) und (4)) = 1 - 6(0+0+4+0+4)/5(25-l)) = 1 - 48/120 = 0,6 

r s schwankt ebenfalls zwischen -1 und +1 mit den bekannten Be- 
deutungen. Dieses Maß wird oft eingesetzt, um festzustellen, wie 
weit Beurteilungen voneinander abweichen. Dann bilden die Urtei- 
le der Gutachter die Merkmale, und die Begutachteten sind die 
Fälle. Es seien z.B. Universitäten begutachtet worden und bzgl. der 
Betreuung der Studierenden durch zwei verschiedene Begutach- 
tungskommissionen in eine Rangreihe gebracht worden, mit fol- 
gendem Ergebnis: 

Tabelle 12.7: Rangreihen von zwei verschiedenen Gutachtern 



Universität 


Gutacht. 1 


Gutacht. 2 


di 2 


A 


1 


3 


4 


B 


2 


1 


1 


C 


3 


2 


1 


D 


4 


5 


1 


E 


5 


4 


1 



Der Rangkorrelationskoeffizient ist dann 

r s = 1 - 6 (1+1+1+ 1+4) / 5 (25-1 ) = 1 - 48/120 = 1-0,4 = 0,6 

und zeigt eine mittlere Übereinstimmung an. 

Der entscheidende Unterschied dieses Maßes zu den anderen 
Rangkorrelationsmaßen aus Kap. 1 1 ist, dass es hier etwas aus- 
macht, wie viel Kategorien die Differenz bilden, wenn sich zwei 
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Fälle unterscheiden, d.h. es wird nicht nur darauf geachtet, wie bei 
den anderen Maßen, ob die Relation zwischen den Kategorien 
dann kleiner oder größer ist, sondern auch, wie viele Kategorien 
kleiner oder größer. Das Paar (A,C) z.B. würde bei allen Maßen 
aus Kap. 1 1 das gleiche Gewicht bekommen wie das Paar (D,C), 
nämlich beide würden als ein discordantes Paar in die Berechnung 
eingehen. In der Spearmanschen Berechnungen bekommt das Paar 
(A, C) aber erheblich mehr Gewicht, weil die Rangunterschiede 
dort doppelt so hoch sind wie beim Paar (D, C). Der Spearmansche 
Koeffizient interpretiert so in die Ordnung der Kategorien einen 
Abstand hinein, der über die strikt ordinale Datenqualität hinaus- 
geht und die Daten über die Rangreihen der Kategorien intervall- 
skaliert. Er liegt deshalb i.A. auch immer über den Werten der 
anderen Rangkorrelationsmaße, ausgenommen y, das ja nur eine 
eingeschränkte Zahl Paare berücksichtigt. 

Wenn die ordinalen Daten in eine Rangreihe gebracht worden 
sind, gibt es natürlich wieder das Problem der Ties, d.h. hier: dass 
in einer Rangliste eine Reihe von Fällen als gleich beurteilt wur- 
den. Dann erfolgt die Zuordnung der Ränge zu den Fällen nicht 
über die Ränge der Merkmalskategorien. Vielmehr werden zu- 
nächst grundsätzlich genau so viele Rangplätze verteilt, wie Fälle 
da sind. Haben dann eine Reihe von Fällen dieselbe Kategorie, 
sind also gebunden, so erhalten sie den Rangplatz, der dem Durch- 
schnittswert ihrer Ränge entspricht. Ein Beispiel: 



Fall 


Kategorie 


Rangplatz 


Rangpl. f. Berechnung 


1 


1 


1 


1 


2 


2 


2 


2,5 = ( 2 + 3)12 


3 


2 


3 


2,5 = (2+3 )/2 


4 


3 


4 


5 = (4+5+6)/3 


5 


3 


5 


5 = (4+5+6)/3 


6 


3 


6 


5 = (4+5+6)/3 


7 


4 


7 


7 



Da eine große Zahl solcher Ties den Koeffizienten wiederum nicht 
die gewünschte Skala von -1 bis + 1 annehmen lässt, gibt es dann 




263 



noch eine Korrekturformel, die bei Vorhandensein von Ties ange- 
wendet werden muss (s. z.B. Clauß u.a.: 78). 

Als Beispiel folgt die SPSS-Berechnung des Spearmanschen 
Rangkorrelationskoeffizienten für die beiden Merkmale aus Kap. 
11.4 (s. die dortige Tabelle 1 1.2a zum Vergleich): 



Symmetrische Maße 





Wert 


Asymptoti 

scher 

Standardf 

ehler 


Näherung 
sweises T 


Näherung 

sweise 

Signifikanz 


Ordinal- bzgl. 


Kendall-Tau-b 


-,246 


,014 


-17,271 


,000 


Ordinalmaß 


Kendall-Tau-c 


-,222 


,013 


-17,271 


,000 




Gamma 


-,361 


,020 


-17,271 


,000 




Korrelation nach 












Spearman 


-,284 


,016 


-17,087 


,000 


Anzahl der gültigen Fälle 




3319 









Man sieht, dass Spearmans Koeffizient höher liegt als die x‘s, 
sogar so hoch, dass er außerhalb des 95% - Konfidenzintervalls 
z.B. von Tb fällt. Er unterscheidet sich also signifikant von den 
anderen Werten, weil er eine höhere Datenqualität annimmt, als 
eigentlich vorhanden ist. 



12.7 Übersicht über alle Zusammenhangsmaße 

Die folgende Übersicht Tabelle 12.8 stellt alle behandelten Zu- 
sammenhangsmaße in einer Tabelle dar. Wie gezeigt worden ist, 
sind die Maße für Daten mit Nominal- und Ordinalskalenqualität 
uneinheitlicher, problematischer und inhaltlich schwieriger zu 
interpretieren als die Maße für metrische Daten. Das ist einer der 
Gründe, weshalb auch in den Sozialwissenschaften möglichst 
immer Intervallskalenniveau angestrebt wird. Da aber gerade sozi- 
ale Daten oft dieses Niveau nur unter fragwürdigen Annahmen 
erreichen, sollte man im Zweifelsfall auch immer die anderen 
Maße auf die Daten anwenden, und sei es nur deshalb, um die 
Ergebnisse, die unter der Annahme von Intervallskalenqualität 
gewonnen wurden, gegen Einwände bzgl. ihrer Skalenqualität 
abzusichern. Nur in seltenen Fällen werden sich dabei die Ergeb- 
nisse widersprechen. 
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III Ordinalskalierte Daten 
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12.8 Korrelation ist nicht Kausalität 

Ein grundsätzliches Problem, das nicht nur die metrischen, son- 
dern alle Zusammenhangsmaße betrifft, ist der Unterschied zwi- 
schen Korrelation und Kausalität, bzw. allgemeiner zwischen ei- 
nem statistischen und einem inhaltlichen Zusammenhang. Wenn 
man statistisch misst, dass zwei Variablen Zusammenhängen, dann 
könnte man versucht sein, diesen Zusammenhang dafür zu nutzen, 
durch Veränderung der einen Variable auf die andere Variable 
Einfluss zu nehmen. Das gelingt nur, wenn der statistische Zu- 
sammenhang einen tatsächlichen Ursache- Wirkungs- Zusammen- 
hang beschreibt. Es gibt drei mögliche Fehlerquellen, die dazu 
führen können, dass das nicht so ist. 

1. Zufall: mit Datenbeständen, die groß genug sind, und nach einer 
Anzahl von statistischen Untersuchungen, die ebenfalls groß ist, 
wird man immer irgendwann irgendeinen Zusammenhang feststel- 
len. Das hegt daran, dass man i.A. nur ein 95% - Konfidenzinter- 
vall nimmt und deshalb die eine oder andere statistische Maßzahl 
eben doch einen Zusammenhang anzeigt, obwohl sie nur zufällig 
zustande gekommen ist (in durchschnittlich 1 von 20 Fähen bei 
einem a-Niveau von 5%). 

2. Richtung: Man kann über die Richtung des Zusammenhangs 
nichts wissen. Beeinflusst das Bildungsniveau die Schichteinstu- 
fung oder umgekehrt? Es kann einerseits sein, dass man über die 
Ausbildung einen Beruf erlangen kann, der in eine bestimmte 
gesellschaftliche Schicht führt. Andererseits kann es aber auch 
sein, dass man die gesellschaftliche Schicht des Elternhauses „ge- 
erbt“ hat, etwa durch Vererbung eines Hofes oder einer Firma, und 
dieses Erbe notwendig mit einem bestimmten Bildungsniveau 
verbunden ist, etwa, um die Firma leiten zu können. In diesem Fall 
hat die Schichtzugehörigkeit das Bildungsniveau bestimmt und 
nicht umgekehrt. Ohne eine Theorie kann man nicht bestimmen, 
was Ursache und was Wirkung ist. 

3. Scheinkausalität: Die dritte Art des Zusammenhangs ist jedoch 
die häufigste und gefährlichste. Sie heißt Scheinkausalität. Sie 
kommt dadurch zustande, dass zwei Merkmale sich zwar in der- 
selben Weise ändern, dass sie aber untereinander gar keine Ver- 




268 



bindung haben, sondern beide mit einem dritten Merkmal verbun- 
den sind, das eine Beziehung zu jedem der beiden ersten Merkma- 
le besitzt. 

Zwei der bekanntesten Beispiele dafür: einmal die frühere 
Vermutung, dass Frauen besser Auto fahren, weil sie weniger 
Unfälle machen. Die Anzahl der Unfälle pro Frau und pro Mann 
sind unterschiedlich, und zwar signifikant. Beides liegt aber an 
einer dritten Variable: der Anzahl der gefahrenen km pro Person. 
Vor allem im LKW-Verkehr, aber auch in vielen Angestelltenbe- 
rufen überwiegen die Männer, also gerade in Berufssparten, in 
denen sehr viel Auto gefahren wird. Die dritte Variable, die uner- 
kannt im Spiel ist, sind also die gefahrenen km. Die Unfallhäufig- 
keit wird umso größer, je mehr km gefahren werden. Ebenso hängt 
das Geschlecht mit den gefahrenen km zusammen: Frauen fahren 
im Durchschnitt pro Person weniger Auto. Es verhindert also keine 
Unfälle, wenn man alle LKW-Fahrer durch LKW-Fahrerinnen 
ersetzen würde, denn dann müssten die Frauen genau so viele km 
fahren. 

Das zweite Beispiel dieser Art beweist, dass tatsächlich der 
Storch die Kinder bringt. In einer Untersuchung in Finnland am 
Anfang des Jahrhunderts wurde nachgewiesen, dass in Gegenden, 
in denen viele Störche gesichtet wurden, auch prozentual mehr 
Kinder geboren wurden als in Gegenden, in denen die Störche rar 
waren. Es wird nun ebenso wenig nützen, wieder mehr Störche 
anzusiedeln, um die sinkenden Geburtenzahlen aufzufangen. Denn 
auch hier ist eine dritte Variable im Spiel, die auf die beiden unter- 
suchten jeweils einwirkt, so dass es aussieht, als wären sie selbst 
verbunden. Es ist die Urbanisierung, also die Tatsache, dass immer 
mehr Menschen in städtischen Ballungsgebieten leben. In diesen 
Gebieten sinkt sowohl die Zahl der Störche, weil ihnen Nistplätze 
fehlen. In diesen Gebieten sinkt aber ebenfalls die Geburtenrate, 
aus verschiedene Gründen, u.a. bessere Freizeitangebote, freiere 
Moralvorstellungen, höhere Scheidungsraten usw. 

Um diese Effekte auch statistisch weiter aufzuklären, muss 
man offensichtlich anfangen, nicht nur zwei, sondern mindestens 
drei oder noch mehr Variablen gemeinsam statistisch zu untersu- 
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chen. Das ist der Hauptgegenstand einer weiterführenden Veran- 
staltung Statistik II mit dem Thema der multivariaten Statistik. 

Die Beispiele zeigen, dass die Statistik tatsächlich nur ein 
Hilfsmittel bleibt, auch wenn sie eine genauere Beschreibung em- 
pirischer Sachverhalte ermöglicht. Ohne eine gehaltvolle Theorie 
über die untersuchten Zusammenhänge nützen statistisch ermittelte 
Kennzahlen nichts. Aber ohne die statistischen Hilfsmittel kann 
man auch keine Theorie an empirischen Daten überprüfen. Dass 
diese Möglichkeit der Überprüfung nicht auf Scharlatanerie be- 
ruht, sondern auf nachvollziehbaren Berechnungen, sollte dieses 
Buch vermitteln. Man kann zwar auf Grund von statistischen Be- 
rechnungen zu verschiedenen Schlüssen gelangen. Man denke an 
die verschiedenen Sicherheitsniveaus oder an die in diesem Kapi- 
tel demonstrierte Möglichkeit, statt mit den Originaldaten mit 
daraus berechneten Werten zu rechnen. In diesem Buch sollte ein 
bisschen von dem Handwerkszeug vermittelt worden sein, um 
statistische Werte, die man anzweifelt, immanent mit statistischem 
Verständnis und mit den Mitteln der Statistik selbst zu hinterfra- 
gen. Man hat das auch einmal „Statistical literacy“ genannt. 



Weitere Literatur zu diesem Kapitel: Clauß u.a.: 74-77, 85-90, 
299-309, Hochstädter 128-138, Kühnel/Krebs: 382-443 

Übungsaufgaben'. 

Die folgende Tabelle enthält die Größe verschiedener Wohnungen 
in Dresden (in qm) und die monatliche Miete, die für diese Woh- 
nungen bezahlt werden muss (in Euro). 



qm 


55 


30 


95 


70 


110 


85 


140 


65 


Miete 


690 


350 


850 


1200 


1450 


1050 


1600 


650 



1. Berechnen Sie die Standardabweichung der Variablen „qm“ und 
„Miete“ und ihre Kovarianz. Bestimmen Sie mit diesen Angaben 
die Größe der Korrelation zwischen Wohnungsgröße und Miete 
dieser 8 Fälle. Können Sie das Ergebnis verallgemeinern? 

2. Um wie viel Euro steigt die Miete „durchschnittlich“ pro qm? 
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Lösungen zu den Übungsaufgaben 

Kapitel 3 

1. a) nominal, b) intervall, c) nominal (kann man nicht mit rech- 
nen!), d) ordinal (es gibt allerdings in der Schulleistungsmessung 
eine intensive Diskussion über die Skalenqualität der 6 deutschen 
Stufen; meist werden Punktesysteme zusätzlich eingesetzt, um 
intervallskalierte Schulleistungen zu erhalten), e) intervall, f) rati- 
onal, g) nominal, h) rational (aber diskret!). 

2. a)Einkommen in Euro - metrisch, quantitativ, stetig 

Gering-/Normal-/Besserverdiener - ordinal, qualitativ, diskret 

b) Anzahl Stunden - metrisch quantitativ, stetig 

allein, in der Gruppe, mit Nachhilfe - ordinal, qualitativ, 
diskret 

c) km/h - metrisch, quantitativ, stetig 

zügig, normal, mit Pausen - ordinal, qualitativ, diskret 

d) Anzahl Zigaretten / Tag - metrisch, quantitativ, stetig 

kein Raucher, Gelegenheitsraucher, Raucher, Kettenraucher 
- ordinal, qualitativ, diskret 



Kapitel 4 



Stundenzahl 


Abs. Häuf. 


Rel. Häuf. 


0 


2 


0,1 


4 


2 


0,1 


6 


3 


0,15 


12 


2 


0,1 


16 


3 


0,15 


20 


4 


0,2 


30 


2 


0,1 


40 


2 


0,1 


SUMME 


20 


1 
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Video / Bestanden? 


Nein 


Ja 


SUMME 


Nicht gesehen 


6 


4 


10 


Einmal gesehen 


3 


7 


10 


Zweimal gesehen 


2 


8 


10 


SUMME 


11 


19 


30 



Kapitel 5 

1. a) Modus, b) Modus, Median, Mittelwert, c) Modus, Median, d) 
Modus, Median 

2. Wenn die Datensätze vereinigt werden, lässt sich der Mittelwert 
der neuen Verteilung berechnen, indem der Mittelwert aus den 
zwei Teilgruppen gemittelt wird: 

_ 5 - 100 + 10 100 „ 

x = = 7,5 

200 

Ein neuer Median oder Modus kann nicht bestimmt werden, da 
man nicht weiß, wie das Merkmal in den Ausgangsdatensätzen 
verteilt ist. 

Kapitel 6 

1. Da hier 20 Daten vorliegen, umfasst jedes Quartil genau 5 Fälle. 
Deshalb ist der Wert des 1. Quartils genau der zwischen dem Wert 
des 5. und des 6. Fall gemittelte Wert und der Wert des 3. Quartils 
entsprechend der zwischen dem Wert des 15. und 16. Falls gemit- 
telte Wert. Da Fall 5 und 6 beide den Wert 6 haben, ist auch Qi = 
6, ebenso folgt Q 3 = 20. Dann muss der Quartilsabstand Q A = (20- 
6)/2 = 7 sein. Das bedeutet, dass der Fernsehkonsum der im mittle- 
ren Bereich liegenden 50% der Befragten um bis zu 14 h unter- 
schiedlich ist. 

2. Mittelwert der Ursprungsdaten = 4,0625, Standardabweichung 
der Ursprungsdaten = 2,1438 



X 


x standardisiert. 


1 


(1 -4,0625)/ 2,1438 = -1,429 


2 


(2 -4,0625)/ 2, 1438 = -0,962 


3 


(3 -4,0625)/ 2, 1438 = -0,496 
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4 


(4-4,0625)/2,1438 = -0,029 


5 


(5-4,06251/2,1438 =0,437 


6 


(6-4,06251/2,1438 = 0,904 


7 


(7-4,06251/2,1438 = 1,370 



Kapitel 7 

1. Für N(0,1) liegt der z a -Wert für a = 95% bei 1,645 (Tabelle 
7.1), darüber liegen die eifrigsten 5%. Die Rücktransformation auf 
die in der Aufgabe vorgegeben N(10,6) lautet 1,645 • 6 + 10 = 
19,87. 

Die Studentin musste sich also fast 20 Stunden vorbereiten, um zu 
den eifrigsten 5% der Studierenden zu gehören. 

2. a) Für einen Frauenanteil von p = 0,2 ergibt sich nach Tabelle 
7.5 der Binomialverteilung für Stichproben der Größe n = 20 ein 
Wert von 0,002 = 0,2% für den Anteil der Stichproben mit genau 
zehn Frauen (k=10). Dies gilt ebenfalls für 10 Männer in der Stich- 
probe. 

b) Ein Frauenanteil von 0,7 entspricht einem Männeranteil p = 0,3. 
Nach derselben Tabelle ergibt sich ein Wert von 0,0308 = 3,08% 
für den Anteil von Stichproben mit genau 10 Männern, also eben- 
falls 10 Frauen (bei einer Gesamtzahl von 20) in der Stichprobe. 

Kapitel 8 

l.a) Die Wahrscheinlichkeit, bei einem Würfelwurf eine bestimm- 
te Zahl zu erzielen, liegt bei 1/6. Durch die Bedingung eines logi- 
schen "Oder" werden die Wahrscheinlichkeiten, beim ersten Wurf 
eine 5 "oder" eine 6 zu werfen, addiert; die Gesamtwahrschein- 
lichkeit beträgt daher 2/6 =1/3. 

b) Es existieren insgesamt drei Möglichkeiten, mit zwei Würfel- 
würfen eine Summe von mehr als oder gleich 1 1 zu erreichen: 
durch eine Fünf beim ersten und eine Sechs beim zweiten Wurf, 
durch die umgekehrte Situation sowie durch zwei Sechsen. Die 
Gesamtzahl aller möglichen verschiedenen Ergebnisse bei zwei 
hintereinander folgenden Würfen ist 36. Da die relative Fläufigkeit 
gleich der Wahrscheinlichkeit ist, ist die gesuchte Wahrscheinlich- 
keit 3/36 = 1/12. 
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2. Die z-Transformation des Werts 133 ergibt (133 - 100) / 20 = 
1,65. Bis zu diesem Wert liegen unter der Standardnormalvertei- 
lung 95% der Fläche (Tabelle 7.1), und genauso auch bei der 
Normalverteilung N(100,20). Dementsprechend liegt die Wahr- 
scheinlichkeit auf einen IQ >= 133 bei 100% - 95% = 5%. 

Kapitel 9 

1 . Es müssen zunächst die Standardfehler berechnet werden: 
Standardfehler West s West = 1,467/ V2284 = 1,467/47,79 = 0,0307. 

Standardfehler Ost s 0st = 1,512/71081 = 1,512/32,88 = 0,046. 
Damit ergeben sich folgende Konfidenzintervalle: 

West: [-1,96-0, 0307+3,92;3, 92+0, 0307-1, 96]= [3,86 ; 3,98] 

Ost: [-1,96-0,046+3,35:3,35+0,046-1,96] = [3,26 ; 3,44], 

Die Mittelwerte der beiden Ländergruppen unterscheiden sich 
signifikant zum Niveau 5% von einander auch in der Grundge- 
samtheit, da die Mittelwerte der einen Gruppe jeweils außerhalb 
des 95 %- Konfidenzintervalls des Mittelwertes der anderen Grup- 
pe liegen. 

2. Hier muss nach LaPlace approximiert werden: 

B(2102;0,048) « N(0,048; „ N(0,048;0,0047) 

Für das 95%-Konfidenzintervall gilt dann: 
[-1,96-0,0047+0,048:1,96-0,0047+0,048] = [0,0388;0,0572] 
d.h. mit 95% Sicherheit liegt der Anteil der „pessimistischen“ 
Jugendlichen zwischen 3,88% und 5,72% (in absoluten Zahlen: 
zwischen 81 und 120h 

Kapitel 10 

1. 

1507-334 -982-3681 

(])= . 1 1 =-0,175 

7(507 + 368)(982 + 334)(507 + 982)(368 + 334) 
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% 2 em P = n ■ <f> 2 = 2191- -0.175 2 = 67,4 

Der Zusammenhang ist nicht zufällig, da % 2 emp = 67,4 > 3,84 = % i. 
Aber er ist schwach, da <J> klein ist. 

2. Die Behauptung kann durch die vorliegenden Daten nicht ge- 
stützt werden, da hier voreilig der Schluss auf Frauen und Männer 
im Allgemeinen gezogen wird. Zu diesem Schluss müsste ein 
Zusammenhangsmaß der Vierfeldertafel (Frauen/Männer, 
viel/wenig ) berechnet und auf Signifikanz geprüft werden. Bei der 
geringen Anzahl Daten und der geringen Differenz von 20% wäre 
eher keine Signifikanz zu erwarten. Zudem könnte das Maß dar- 
über Auskunft geben, wie stark der Zusammenhang wäre. 

Kapitel 11 

I. a) Summe der konkordanten Paare Nc = 3(7+5) + 35 = 36 + 15 
= 51, Summe der diskordanten Paare Nd = 1(1+7) + 3-1 = 8 + 3 = 

II, Gamma = (51-1 1 )/(5 1+11) = 0,64. Gamma weist damit einen 
stärkeren (mehr als mittelstarken) Zusammenhang auf. Ein Wert 
von ca. 2/3 bedeutet, dass man bei ca. 2/3 aller nicht gebundenen 
Paare aus der Differenz bei dem einen Merkmal auf dieselbe Dif- 
ferenz bei dem anderen Merkmal schließen kann. 

b) Nach der Formel gilt für die Varianz der Differenz S = Nc - Nd: 
s s 2 = l/18-20-(20-l)-(2-20-5)= 738,9, und für die Standardabwei- 
chung Ss = 7738,9 = 27,18. Damit ist der standardisierte Wert von 
S (der Testwert) (Nc - Nd)/ s s = (51-1 1)/27,18 = 40/27,18 = 1,47. 
Dieser Wert ist kleiner als 1,96, der kritischen Grenze, innerhalb 
derer 95% aller zufällig zustande gekommenen Differenzen S 
(standardisiert) liegen. Damit kann man auf der Grundlage dieser 
20 Daten nicht behaupten, dass in der Grundgesamtheit überhaupt 
ein Zusammenhang besteht. Der in a) festgestellte starke Zusam- 
menhang ist zufällig. Das gilt um so stärker für ein höheres Si- 
cherheitsniveau, z.B. 99%. 

Kapitel 12 

1. Variable qm: Mittelwert: 81,25, 

Varianz = 8187,5/7= 1169,643 
Variable Miete: Mittelwert: 980,00 
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Varianz = 1265400 / 7 = 180771,4 
Standardabweichung qm = yjl 169,34 = 34,2 

Standardabweichung Miete = -y/l 8077 1,4 = 425,17 
Zur Berechnung der Kovarianz sind die Tabelle 12.2 entsprechen- 
den Berechnungen durchzuführen. Dann ergibt sich die Kovarianz 
s xy zwischen qm (x) und Miete (y) 
s xy = 91200/7 = 13028,6. 

Damit ist die Korrelation r zwischen qm und Miete 
r xy = 13028,6/(34,2_425,17) = 0,896. 

Um die Korrelation zu verallgemeinern, muss die Tabelle für die 
Signifikanz von r (Tabelle 12.3) herangezogen werden. Die Frei- 
heitsgrade betragen hier n - 2 = 6. Die Tabelle sagt aus, dass bei 5 
Freiheitsgraden und einem Fehler-Niveau von 5% r schon durch 
Zufall r Werte bis 0,75 annehmen kann. Da die berechnete Korre- 
lation darüber liegt, kann der festgestellte Zusammenhang „je 
größer die Wohnung, desto höher die Miete“ verallgemeinert wer- 
den. 

2. Der Regressionskoeffizient b aus der Regressionsgerade ‘Miete 
= a + b • qm‘ gibt an, um wie viel die Miete „durchschnittlich“ pro 
qm steigt. Aus der Definition der Regressionsgeraden ergibt sich, 
dass b = s xy / s x 2 . Aus der Beziehung zwischen R : und r ergibt sich, 
dass r = s xy / (s x ■ s y ). Also kann man berechnen b = r • s y / s x . In 
diesem Fall also 



b = 0,896 -425,17/ 34, 2= 11,14 Euro. 
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